GPT-4와 AI 기술의 최신 동향최근 공개된 GPT-4는 AI 기술의 새로운 도약을 의미합니다. 특히 이번 버전은 대화 능력과 이미지 생성 능력에서 큰 개선을 이루었습니다. 다음은 GPT-4의 주요 특징과 업데이트 내용에 대해 상세히 설명하겠습니다.새로운 GPT-4 모델 공개GPT-4는 AI 기술의 혁신을 보여줍니다. 특히 실시간 대화 능력과 자연스러운 목소리 생성 기능이 주목할 만합니다. 예를 들어, 시각 장애인을 위해 실시간으로 상황을 설명해 주는 비마이아이(Be My Eyes) 기능은 사용자의 요청에 신속하게 반응하며, 마치 실제 사람이 대화하는 것처럼 자연스럽습니다.응답 속도 또한 크게 개선되어, 0.2초 만에 응답할 수 있습니다. 이는 실제 사람과 대화하는 것과 비슷한 수준으로, AI와의 상호..
2024 구글 IO에서 공개된 AI의 미래2024년 구글 IO에서 공개된 AI 기술들은 앞으로의 기술 발전과 우리 일상에 큰 영향을 미칠 혁신적인 기능들을 담고 있습니다. 이번 행사는 특히 구글의 최신 AI 모델 제미나 1.5와 다양한 AI 기능들이 어떻게 우리의 삶을 변화시킬 수 있는지에 초점을 맞추었습니다. 제미나 1.5: PDF와 동영상 분석의 혁신구글은 제미나 1.5를 통해 PDF 1500페이지 또는 1시간 길이의 동영상을 분석할 수 있는 능력을 선보였습니다. 이는 문서와 미디어를 보다 효율적으로 다룰 수 있게 하여, 정보 접근과 분석에 혁신을 가져올 것입니다. 이 모델은 최대 200만 토큰을 지원하며, 일부 사용자에게 무제한 텍스트를 제공할 목표를 가지고 있습니다. 이러한 기능은 연구자, 학생,..
https://youtu.be/k3ApZg695dQ?si=sAj-ZgZh7Khpd7wA ChatGPT Spring UpdatesHello GPT-4o | OpenAIGPT4o 공개다음 영상에서 GPT-4o 에 대해 자세히 포스팅 할 예정 Open AI + StackOverflowgithub copilot 만큼의 성능이 나올까 싶음 OpenAI Model Spec 공개Introducing the Model Spec | OpenAI이것은 OpenAI API 및 ChatGPT에서 모델에 대해 원하는 동작을 지정하는 문서인 모델 사양의 첫 번째 초안입니다. 여기에는 일련의 핵심 목표와 상충되는 목표 또는 지침을 처리하는 방법에 대한 지침이 포함됩니다. 이와 관련해서 곧 공개될 sora에 nsfw 컨텐츠 생..
https://youtu.be/mh5M3Ox5bDc?si=bO-eCG8pjnu3ABGf gpt2https://namu.wiki/w/gpt2 gpt2gpt2 OpenAI CEO인 샘 알트만의 X에 올라온 이름 기반 는 2024년 4~5월 챗봇 아레나 를 통해 비namu.wiki https://news.aikoreacommunity.com/gpt2-model-review-and-testing-methods/ 의문의 GPT2 모델, 성능 후기 및 테스트 방법24년 4월 말에 출시된 im a good gpt2 chatbot과 also a good gpt2 chatbot이 최근 성능이 좋다는 평가가 퍼지면서 이슈가 되었습니다. 웹사이트 LMSYS에 갑자기 등장한 GPT2 chatbot. 국내 커뮤니티와 해외 ..
https://youtu.be/eaef8Tr7uRo?si=C7en3be_HFFN90r0 영상헤이젠실시간 번역 AI영상을 업로드하면 다른나라 언어로 음성을 번역하며, 목소리도 그대로 사용할 수 있고 입모양도 언어에 맞게 조금 바꿔준다고 한다.HeyGen - AI Spokesperson Video Creator Video Translate by HeyGen Labs labs.heygen.com Pika arttext to videoPika PikaThe idea-to-video platform that sets your creativity in motion.pika.art Runway여러 기능이 추가되어 사이트내에서 모션브러쉬를 사용하여 정교한 편집이 가능해졌다고 Runway - Advancing crea..
https://youtu.be/_LUG9bmJBC0?si=rwdkzjiUuS8hzPF2 https://youtu.be/xsLVFZDpNIs?si=yCkDbby2t0jg-51i Gemini는 Google과 DeepMind이 개발한 멀티모달 생성형 인공지능 모델입니다. 텍스트뿐만 아니라 오디오, 이미지, 비디오와 같은 다양한 입출력을 지원합니다. Gemini는 2023년 5월 10일 Google I/O 2023에서 처음 공개되었으며, 2023년 12월 6일 세 가지 모델로 구성된 공개 버전이 출시되었습니다. Gemini의 주요 특징은 다음과 같습니다. 다양한 입출력 형식을 지원합니다. 텍스트, 오디오, 이미지, 비디오 등 다양한 입력과 출력을 처리할 수 있습니다. 멀티모달 성능이 뛰어납니다. 텍스트와 이미지..