ChatGPT 이제 보고, 듣고, 말할 수 있습니다.

ChatGPT 이제 보고, 듣고, 말할 수 있습니다.

OpenAI는 ChatGPT에 새로운 음성 및 이미지 기능을 추가하였습니다. 이로써 ChatGPT는 사용자와 음성 대화를 나누거나 사용자가 어떤 것을 이야기하는지 시각적으로 보여줄 수 있는 새로운 직관적인 인터페이스를 제공합니다.

이 음성 및 이미지 기능은 ChatGPT를 보다 다양한 방식으로 활용할 수 있게 해줍니다. 여행 중이라면 랜드마크의 사진을 찍어 관련된 내용에 대해 실시간으로 대화할 수 있습니다. 또한, 집에서는 냉장고나 식료품 보관함의 사진을 찍어 저녁 식사 메뉴를 결정하거나 단계별 레시피를 위해 추가 질문을 할 수 있습니다. 더 나아가 저녁 식사 후에는 자녀에게 수학 문제를 사진으로 찍어 도움을 줄 수도 있습니다. 문제를 강조하고 힌트를 함께 공유할 수 있습니다.


음성 및 이미지 기능은 앞으로 2주 동안 Plus 및 Enterprise 사용자들을 대상으로 서서히 출시될 예정입니다. 음성 기능은 iOS 및 Android에서 이용할 수 있으며, 이미지 기능은 모든 플랫폼에서 사용 가능합니다.

ChatGPT와 음성으로 대화를 나누고 그에 대한 응답을 받을 수도 있습니다. 이동 중에는 ChatGPT와 대화를 나누어 가족을 위한 침대 이야기를 요청하거나 저녁 식사 토론을 해결할 수 있습니다. 음성 기능을 사용하려면 모바일 앱의 설정에서 새로운 기능으로 이동하여 음성 대화에 참여할 수 있도록 설정해야 합니다. 그 후에는 홈 화면의 오른쪽 상단에 위치한 헤드폰 버튼을 탭하여 다섯 가지 다른 음성 중에서 선호하는 음성을 선택할 수 있습니다.


이 새로운 음성 기능은 텍스트와 짧은 샘플 음성만으로도 인간과 유사한 음성을 생성할 수 있는 새로운 텍스트 음성 변환 모델을 기반으로 합니다. OpenAI는 전문 음성 배우들과 협력하여 각각의 음성을 만들었으며, 음성을 텍스트로 변환하기 위해 자사의 오픈소스 음성 인식 시스템인 Whisper를 사용합니다.

또한, ChatGPT는 이미지에 대한 대화도 가능합니다. 사용자는 ChatGPT에게 하나 이상의 이미지를 보여줄 수 있습니다. 예를 들어, 그림이 작동하지 않는 이유를 파악하거나 식료품 보관함의 내용을 확인하여 식사 계획을 세울 수 있습니다. 또한, 업무 관련 데이터의 복잡한 그래프를 분석할 수도 있습니다. 이미지의 특정 부분에 초점을 맞추기 위해서는 모바일 앱의 그리기 도구를 사용할 수 있습니다.


이미지 이해 기능은 다중모델을 사용하여 여러 이미지를 처리할 수 있습니다. OpenAI는 대량의 데이터셋을 사용하여 다양한 이미지 유형과 컨텍스트에 대한 이해력을 향상시켰습니다. 또한, 모델은 이미지에 대한 설명을 생성하기 위해 자연어 처리 기술을 사용합니다.


OpenAI의 연구원들은 이미지와 관련된 질문에 대한 답변을 생성하는 데 초점을 맞추었습니다. 예를 들어, "이 사진은 어디에서 찍혔나요?"나 "이 음식은 어떤 재료로 만들어졌나요?"와 같은 질문에 모델이 적절한 답변을 제공할 수 있습니다.

OpenAI는 ChatGPT의 시각, 청각, 음성 기능을 계속해서 개선하고 확장할 예정입니다. 이를 통해 사용자들은 더욱 풍부한 대화 경험을 할 수 있으며, ChatGPT가 다양한 맥락에서의 유연한 지원을 제공할 수 있습니다.


ChatGPT의 음성 및 이미지 기능은 사용자들에게 새로운 창조적 가능성을 제공합니다. 사용자들은 이를 활용하여 문제 해결, 창작, 학습 등 다양한 분야에서 유용한 도구로 활용할 수 있습니다. OpenAI는 사용자들의 피드백을 수집하고 모델을 계속 개선하기 위해 노력할 것입니다.

ChatGPT의 시각, 청각, 음성 기능은 미래의 AI 기술 발전을 대변하는 중요한 마일스톤입니다. OpenAI는 더 나은 인공지능 시스템을 개발하기 위해 계속해서 연구를 진행하고 사용자들에게 혁신적인 기능을 제공할 것입니다.

Discussions (0)

Contenjoo
@콘텐주

20 팔로워

관련 블로그

AI 50: 미래의 기업
AI 50: 미래의 기업
생성 AI, 기업 생산성 혁신 주도 2024년 AI 50 기업 순위에 따르면 생성 인공지능(AI)이 기업의 업무 생산성 향상을 이끌고 있는 것으로 나타났습니다. 생성 AI 대세 부상 - 지난해에는 생성 AI가 AI 기술 발전의 배경에 머물렀지만, 올해에는 기업과 개인 고객 모두에게 생산성 향상의 초기 단계를 보여주며 주목받고 있습니다. - 미국 AI 벤처 투자의 60%가 대규모 언어모델 기업에...
2024년 세계에서 가장 혁신적인 기업들
2024년 세계에서 가장 혁신적인 기업들
Fast Company는 매년 "세계에서 가장 혁신적인 기업들" 순위를 발표하며, 광고에서 비디오에 이르기까지 58개 산업 및 부문을 포함합니다. 이 순위는 이제 우리 손에 들어온 것으로 보이는 아이디어와 기술들을 추적합니다. 2024년의 목록에는 Nvidia의 칩과 플랫폼 위에 구축되고 OpenAI 및 Microsoft와 같은 기업에 의해 대중화되고 있는 생성 AI가 포함됩니다. 또한 Credo AI 같은 신흥 AI...
2023-2024년에 주목해야 할 12가지 SaaS 트렌드: 시장 개요
2023-2024년에 주목해야 할 12가지 SaaS 트렌드: 시장 개요
마케팅 기술(Martech): 고객 관련 영역에서 의사 결정의 정확성을 향상시키기 위한 기술로, 예측 분석, 기계 학습, 인공 지능이 포함됩니다. 예를 들어, Canva는 비디자이너도 마케팅 자료를 쉽게 생성하고 즉시 사용할 수 있는 도구입니다.인공 지능(AI): AI는 CRM 및 고객 서비스 솔루션과 결합되어 고객의 요구에 더 빠르게 대응하고 이를 충족시키는 데 도움이 됩니다. 예시로,...
SaaS 산업 트렌드(2024년) 11.
SaaS 산업 트렌드(2024년) 11.
AI의 고급 통합: SaaS 공급자들이 제품 가치 향상과 사용자 작업 효율성 증가를 위해 AI를 적극 통합하고 있습니다. 예를 들어, Canva는 사용자 프롬프트에 기반한 디자인 생성을 위해 Magic Studio와 같은 AI 도구를 제공합니다.협업 소프트웨어에 대한 수요 증가: 원격 근무 확산으로 인해 협업 도구에 대한 수요가 증가하고 있습니다. Slack, Microsoft Teams, FigJam 등이 인기를 끌고 있으며,...
디자인을 쉽게! 캔바를 대체할 수 있는 10가지 무료 도구
디자인을 쉽게! 캔바를 대체할 수 있는 10가지 무료 도구
디지털 시대에서 시각적 컨텐츠는 매우 중요한 역할을 합니다. 이제는 누구나 쉽고 빠르게 멋진 디자인을 만들 수 있는 도구들이 많이 있습니다. 오늘은 캔바를 대체할 수 있는 10가지 인기 있는 디자인 도구들을 소개하고자 합니다. 이들 각각은 특별한 기능과 장점을 가지고 있어, 당신의 창의적인 아이디어를 현실로 만들어줄 것입니다.Fotoram.io설명: 이는 무료 사진...