AI 소식 7

춤추는 모나리자를 만들 수 있다고? - MagicAnimate

사진 1장만 있으면 비디오를 만드는 시대라는 주제로 Anymate Anyone 이라는 프로젝트를 소개한 적이 있는데요. 오늘 소개할 주제는 'MagicAnimate' 라는 따끈따끈한 논문 입니다. MagicAnimate는 Diffsion 모델을 기반으로 한 애니메이션 프레임워크 입니다. 사진 1장만 있으면 비디오를 만드는 시대 - Animate Anyone 안녕하세요! '에이아이 나도 할 수 있다!' 의 애나입니다. 오늘은 새로운 AI 소식을 들고 왔습니다. 바로 최근에 발표된 "Animate Anyone" 프로젝트입니다. Animate Anyone는 말 그대로 누구나 이미지로 비 anna-ai.tistory.com MagicAnimate의 특징 튀는 프레임 없이 시각적 일관성을 강화하고, 입력으로 들어..

AI 소식 2023.12.10

원하는 음악 찾기 힘든가요? 입력만 하세요 - Meta의 Audiobox

안녕하세요. 애나입니다. 오늘은 Meta에서 새롭게 발표한 새로운 오디오 생성 모델 'Audiobox'를 소개해드려고 합니다. Meta에서 올해 초 제작했던 'Voicebox' 에서 더욱 발전한 모델로 음성이나 소리 효과를 텍스트 입력으로 쉽게 생성할 수 있는 오디오 생성 모델 입니다. 이 모델의 가장 큰 특징은 사용자가 원하는 소리나 음성 유형을 자연어로 서술하면, 그에 맞는 오디오를 생성한다는 점이죠. 예를 들어, "강물이 흐르는 소리와 새가 지저귀는 소리" 를 입력하면 원하는 사운드 스케이프를 쉽게 생성할 수 있습니다. 간단 요약AudioBox는 메타가 새롭게 발표한 오디오 생성을 위한 AI 모델 입니다.AudioBox 는 자연어 텍스트 프롬프트를 조합해서 음성 및 음향 효과를 생성할 수 있습니다...

AI 소식 2023.12.08

어쩌면 챗GPT를 무너뜨릴 구글의 AI - Gemini

안녕하세요. 애나입니다. 오늘은 그저께 발표된 Google 의 AI인 Gemini에 대한 소식을 들고 왔습니다. 구글의 Gemini AI는 텍스트, 이미지, 오디오, 비디오 같이 다양한 정보 유형을 이해하고 처리할 수 있는 멀티모달 AI 모델입니다. Gemini는 MMLU에서 90%의 점수를 획득하며 전문가들을 뛰어넘 최초의 AI 모델이 되었습니다. 이 멀티모달 AI 모델은 이미지, 비디오, 오디오를 포함한 다중 모드 벤치마크에서 GPT-4V와 Whisper를 넘어서는 성능을 보여주었습니다. Google Deep Mind 에서 공개한 데모 영상입니다. 영상을 보시면 지도를 펼쳐놓고 나라 맞추기 게임을 하고, 가위바위보를 순차적으로 내자 가위바위보 게임을 인지하고 승부를 걸기도 합니다. 이 영상을 보니 정..

AI 소식 2023.12.07

AI로 할 수 있는 Upscaling의 신세계 - Magnific AI

안녕하세요. '에이아이 나도 해보기'의 애나입니다. 혹시 화질구지라고 들어보셨나요? 2007년 네이버 지식iN에 한 네티즌이 새끼 딱새의 사진을 올리고 '이게 무슨 새인가요?'라고 질문한 것에 한 답변자가 띄어쓰기 없이 '화질구지네요.' 라는 답변을 남겼죠. 첫 답변을 보고 오해한 사람들이 새의 이름을 '화질구지' 라고 답변하면서 전설적인 짤이 탄생했습니다. 요즘은 오히려 화질구지인 사진을 찾아보기 힘들 정도로 이미지가 모두 고해상도인데요. 기술이 발달하면서 화질구지는 멸종 위기가 되었습니다. 하지만 그럼에도 불구하고 디지털 풍화를 겪거나 과거에 만들어진 이미지는 저화질인 경우가 많습니다. 이럴 때 쓸 수 있는 아주 놀라운 AI 툴을 소개해드리려고 합니다. 바로 Magnific AI라는 서비스 입니다. ..

AI 소식 2023.12.06

챗 GPT보다 똑똑한 의료 인공지능 - Towards Accurate Differential Diagnosis with Large Language Models

안녕하세요, 애나입니다. 오늘은 의료 분야에서 인공지능의 역할에 대한 매우 흥미로운 연구를 소개하려고 합니다. 제목은 "Towards Accurate Differential Diagnosis with Large Language Models"로, 최근 arXiv에 게재된 논문입니다. 인공지능으로 이해하는 감별진단: 새로운 도약 감별진단은 의료 분야에서 환자의 증상의 원인을 파악하는 기본적인 과정입니다. 차별 진단은 임상 이력, 신체검사, 다양한 조사 및 검사를 통해 해석되는 매우 복잡하면서 중요한 작업 입니다. 전통적으로 이 과정은 의료진의 전문 지식, 경험 및 이용 가능한 의료 자원에 크게 의존하고 있었습니다. 하지만 인공지능의 등장으로 이 분야에 새로운 변화의 가능성이 발견되었습니다. 이 연구에서 가장..

AI 소식 2023.12.04

Google이 가져올 새로운 혁신 - Google Deepmind 의 GNoME

안녕하세요! 안녕하세요! '에이아이 나도 할 수 있다!' 의 애나입니다. 올 한 해는 구글과 챗 GPT의 치열한 대결이 펼쳐졌던 해였습니다. 검색 시장의 영원한 강자일 것 같았던 구글이 챗 GPT가 등장으로 자리를 위협받았는데요. 구글은 대화형 AI 서비스인 바드(Bard)를 발표하기도 했습니다. 이렇게 AI 산업에서 치열한 경쟁을 벌이고 있는 구글이 지난주에 놀랄만한 소식을 발표했습니다. 구글의 딥마인드에서 발표한 GNoME이 그 주인공입니다. GNoME이 뭔가요? GNoME 은 구글의 딥마인드가 개발한 220만 개의 새로운 결정 구조를 발견한 AI입니다. 이 실험에 성공한다면 초전도체, 슈퍼컴퓨터, 전기차용 첨단 배터리 분야에서 획기적인 발전을 이룰 것으로 기대하고 있습니다. GNoME의 혁신적인 발..

AI 소식 2023.12.03

사진 1장만 있으면 비디오를 만드는 시대 - Animate Anyone

안녕하세요! '에이아이 나도 할 수 있다!' 의 애나입니다. 오늘은 새로운 AI 소식을 들고 왔습니다. 바로 최근에 발표된 "Animate Anyone" 프로젝트입니다. Animate Anyone는 말 그대로 누구나 이미지로 비디오를 생성하는 것을 목표로 개발된 기술입니다. 이미지 1장만 있으면 영상을 만든다고요? 이미지를 영상로 만들기 위해서는 딱 2가지가 필요합니다. 바로 움직이게 만들고 싶은 레퍼런스 이미지와 동작을 가이드 해줄 수 있는 뼈대가 필요합니다. 데모를 보시면 훨씬 이해가 쉬울 거예요. 이렇게 원하는 사진 1장과 뼈대만 있으면 자연스러운 영상을 만들 수 있습니다. 사람, 애니메이션, 3D 캐릭터까지 어떤 스타일의 이미지든 움직이는 영상이 되네요. 너무 신기하죠? 사실 이미지를 비디오로 만..

AI 소식 2023.12.03