[디지털경제뉴스 박시현 기자] 메타가 10일 ‘메타의 AI 미디어 브리핑’ 행사를 개최, 오픈소스 대규모 언어모델인 ‘라마’를 중심으로 한 AI 기술 및 오픈소스 접근 방식과 메타 인공지능 연구소 FAIR(Fundamental AI Research)의 연구 내용을 발표했다.
◆‘라마’로 파생된 AI 모델, 6만 5천개 넘어 = 이번 행사는 그동안 메타가 걸어온 행보와 AI 기술 및 연구 성과를 공유하기 위해 마련됐다. 마노하 팔루리 메타 생성형 AI 부사장과 메타 FAIR 연구팀, 장광선 한국과학기술정보연구원(KISTI) 선임연구원이 발표자로 나서 ▲라마의 성과 및 오픈소스 접근 방식 ▲국내 라마 활용 사례 ▲FAIR의 최신 연구 내용 등을 소개했다.
이날 첫 발표자로 나선 마노하 팔루리 부사장은 라마가 일궈낸 그간의 성과와 커뮤니티 주도의 혁신을 촉진하는 핵심 기술로서의 역할을 공유했다. 메타는 최근 발표한 라마 3.2 모델을 포함해 총 4번의 성공적인 배포를 마쳤으며, AI 커뮤니티 내에서의 영향력을 키워나가고 있다. 구체적으로 현재까지 라마 모델은 4억 회 이상 다운로드됐으며, 이는 작년 대비 10배 증가한 수치다. 라마 모델은 교육, 헬스케어 분야 등 스타트업부터 대기업까지 수많은 비즈니스에 다양한 용도로 활용되고 있으며, 라마로 파생된 AI 모델은 6만 5천 개 이상에 달한다.
팔루리 부사장은 이처럼 메타가 오픈소스 접근 방식을 추구하는 이유로 “개방형 생태계가 기술 혁신의 속도를 가속화하고, 안전성과 투명성을 높이는 데 기여할 수 있기 때문이다. 특히 오픈소스 모델은 개발자가 본인만의 모델을 훈련하고 미세 조정할 수 있도록 하며, 오랫동안 지속가능한 시스템을 구축할 수 있도록 돕는다”고 했다.
팔루리 부사장은 "메타의 장기적인 목표는 범용 인공지능(AGI)을 구축하고 이를 책임감 있게 오픈 소스로 공개해 모든 사람이 AI의 혜택을 누릴 수 있도록 하는 것"이라며, "AI 기술은 단순히 기업의 성장을 넘어, 사회와 경제에 큰 가치를 제공할 수 있다"고 전했다.
◆국내 라마 활용 사례 ‘과학기술정보 특화 대형언어모델, 고니’ = 장광선 선임연구원은 KISTI의 과학기술정보 특화 대형언어모델인 고니(KONI: KISTI Open Natural Intelligence)를 구축한 사례를 소개했다.
고니는 라마 모델을 기반으로 과학기술 데이터를 추가 학습했으며, 이를 통해 국내 연구기관과 공공기관에 특화된 과학기술정보 서비스를 제공하는 것을 목표로 하고 있다. 장 선임연구원은 라마의 오픈소스 특성과 비교적 적은 자원으로 보안성이 높은 모델을 구축할 수 있는 점을 고려해 선택했다고 설명했다. 고니는 ScienceON과 AccessON 등 KISTI의 주요 서비스에 적용될 예정이며, 향후 한전전력연구원과 농림식품기술기획평가원 등 타 공공기관에서도 활용될 계획이다. 이를 통해 연구자들은 방대한 과학기술 데이터를 보다 효율적으로 요약하고 활용할 수 있으며, 관련 분야 전문가들은 최신 연구 동향을 쉽게 분석하고 필요한 정보를 빠르게 얻을 수 있게 될 전망이다.
◆메타 FAIR 연구소, 개방적이고 책임감있는 연구 앞장 = 마지막 발표자로 나선 니킬라 라비와 후안 피노 메타 FAIR 연구팀 리서치 엔지니어링 매니저는 FAIR 연구소에 대한 전반적인 소개와 함께, 연구팀에서 장기적으로 투자해오며 진행한 연구 결과들을 공유했다.
니킬라 라비 연구원은 지난 10년 동안 FAIR 연구팀이 개방적이고 책임감 있는 연구의 길잡이 역할을 자처하며, 연구 결과를 투명하게 공개하고자 노력해왔다고 설명했다. 실제로 FAIR 연구팀은 현재까지 1,000개 이상의 오픈 소스 라이브러리, 모델 및 데이터 세트 등을 공개적으로 배포했다.
니킬라 라비 연구원은 또한 FAIR 연구팀은 실생활 속 문제를 해결하는 데 기여할 수 있는 기술 개발 및 연구에 집중해왔으며 그 대표적인 기술로 ‘SAM 2(Segment Anything 2)’ 모델을 소개했다. Sam 2는 이미지와 영상 속에서 실시간으로 물체를 인식하는 모델로, 기존에 이미지만 인식 가능했던 SAM의 업그레이드된 결과물이다. 기존 모델 대비 3배 더 적은 시간으로 보다 높은 인식률을 보이며, 제로샷 일반화 성능을 통해 생소한 물체도 쉽게 인식 가능하다. 이를 통해 정밀한 물체 인식이 필수적인 해양 과학 및 의료 분야에 혁신적으로 활용할 수 있다.
이어 피노 연구원은 FAIR 연구팀의 주요 기술 중 ‘SeamlessM4T’와 ‘오디오박스’를 소개했다. 먼저, SeamlessM4T는 음성과 텍스트를 넘나들며 즉각적인 번역을 제공함으로써 언어의 제약 없이 보다 효과적인 소통을 지원한다. 현재 최대 100개의 언어에 대한 음성-텍스트, 음성-음성, 텍스트-음성, 텍스트-텍스트 번역을 수행할 수 있다. 오디오 생성 모델인 오디오박스는 음성 및 텍스트 명령을 통해 특정 용도에 맞춤화된 음향 효과 또는 자연스러운 목소리를 제작할 수 있도록 돕는다.
마누하 팔루리 메타 생성형 AI 부사장은 “오픈 소스 분야에서 오랜 역사를 보유하고 있는 메타는 개방형 생태계를 넓혀가기 위해 다양한 이해관계자들과 협업하고 있다”라며, “앞으로도 메타는 책임감 있는 AI 연구와 오픈소스 접근 방식으로 전 세계 모두가 최첨단 기술의 혜택을 누릴 수 있도록 노력하겠다”라고 전했다.