만물박사 아닌 전문 박사 싸고 가벼운 AI가 뜬다
본문
빅테크 소형 거대언어모델 경쟁 마이크로소프트 는 지난 21일 미국 워싱턴 레드먼드 MS 본사에서 개발자 회의 빌드 2024′를 열고 이미지 분석이 가능한 소형 거대 언어 모델 파이3 비전을 발표했습니다.
MS는 그동안 협업 관계인 오픈AI의 거대 언어 모델 인 GPT를 활용해 인공지능 서비스를 해왔습니다. LLM은 천문학적 용량의 데이터를 학습하고 생성하는 역할을 하는 모델로 생성형 AI 개발의 기반이 됩니다. 만능 AI로 불리는 GPT는 생성형 AI가 학습추론을 할 때 데이터를 서로 연결해 주는 파라미터 가 1조개 정도 됩니다. 반면 파이3 비전의 파라미터는 42억개에 불과합니다. 파라미터가 적으면 처리하는 데이터 수가 줄어 제공하는 정보의 양도 적지만 운영 비용은 크게 낮아집니다. MS는 파이3 비전은 시각 추론 작업 표나 차트 이해 작업에 특화한 모델이라며 비슷한 성능을 지닌 다른 모델 대비 비용은 10분의 1에 그친다고 밝혔습니다. 업계 관계자는 모든 자동차를 스포츠카처럼 고성능으로 만들지 않고 용도에 따라 경차소형차대형차도 생산하듯이 생성형 AI도 가성비에 맞는 저용량 모델이 나오는 것이라고 말했습니다.
거대 언어 모델 개발 질주에 나섰던 빅테크들이 올해 들어 잇따라 sLLM 모델을 내놓으며 생성형 AI 시장 공략에 나서고 있습니다. sLLM은 말 그대로 소형화하고 경량화한 거대 언어 모델을 말합니다. 기본 조 단위 파라미터를 갖는 기존 LLM과 달리 적게는 수십억 개 단위의 파라미터로 운영이 가능해 훈련 시간과 운영 비용 전력 소모량이 획기적으로 적은 게 특징입니다. MS구글메타까지 sLLM 경쟁올해 들어 글로벌 빅테크는 sLLM을 속속 출시하고 있습니다. MS가 파이3를 내놓은 데 앞서 지난달 메타는 파라미터 80억개의 라마3 앤스로픽은 방대한 양의 연구 논문 요약에 특화된 클로드3 하이쿠를 국내 기업 네이버는 하이퍼클로바X 대시를 내놨다. 이들은 공통적으로 파라미터가 수십억 개에 그친다는 특징이 있습니다. 이 때문에 비용은 훨씬 저렴하고 속도는 빠르다.
빅테크들이 sLLM 개발에 뛰어드는 건 수익성 때문입니다. LLM은 성능은 좋지만 개발에 천문학적 비용이 들고 사용처도 빅테크에 국한됩니다. 아직은 수익성이 떨어질 수밖에 없습니다. 하지만 sLLM은 스타트업들도 사용할 수 있게 비용을 낮췄다. 맛있는 감 활용 방법 그리고 효능 체크 파이낸셜타임스 는 비싼 비용을 우려하는 일반 기업들이 조금 더 쉽게 AI 도입을 할 수 있도록 하기 위한 빅테크들의 노력이라며 LLM을 구축하기 위해 수십억 달러를 쓴 빅테크들이 수익을 내기 위해 sLLM을 속속 내놓고 있다고 분석했습니다. 실제 sLLM은 LLM에 비해 비용이 크게 저렴합니다. FT에 따르면 100만 토큰 기준으로 LLM인 구글의 제미나이 1.
5 프로는 7달러 GPT-4o가 5달러의 비용이 든다. 예컨대 한 기업이 빅테크가 개발한 LLM을 활용해 서비스나 앱을 만들 경우 영 단어 기준 100만개의 답변을 얻을 때마다 이 돈을 빅테크에 지불해야 한다는 뜻입니다. 하지만 대부분의 sLLM은 비용이 100만 토큰 기준 1달러 미만입니다. 업계 관계자는 AI 시대에 맞춰 관련 서비스를 만들고 싶어도 막대한 비용 탓에 선뜻 도입을 꺼렸던 기업들 입장에선 싸고 가벼운 sLLM이 입문용으로 도전해볼 만한 것이라고 말했습니다. 수익성활용성에 강점sLLM은 수익성뿐 아니라 활용성 측면에도 강점이 있습니다. 작고 가볍기 때문에 클라우드 를 거치지 않고 기기 안에서 AI 서비스를 제공하는 온디바이스 AI를 구현할 수 있습니다. 실제 삼성전자는 올해 초 첫 AI 스마트폰 갤럭시S24를 내놓으며 구글의 sLLM 모델 제미나이 나노를 탑재했습니다.
애플도 올해 아이폰에 AI를 구동하기 위해 자체 sLLM을 개발하고 있는 것으로 알려졌습니다. 의료법률금융 등 각 기업이 필요한 특정 목적에 맞게 맞춤형으로 개발 가능하다는 것도 장점입니다. 국내에서는 KT가 기존 2100억개 이상의 파라미터를 가진 LLM 믿음을 70억~400억개 수준으로 경량화해 특정 분야에 제공할 계획입니다. 국내 AI 스타트업 업스테이지는 최근 sLLM 솔라미니를 출시했고 리걸테크 스타트업 로앤컴퍼니와 법률에 특화된 서비스를 개발하고 있습니다. ☞sLLM small Large Language Model의 약자. 오픈AI의 GPT나 구글의 제미나이처럼 방대한 양의 데이터를 학습해 모든 질문에 답하는 거대언어모델 과 달리 주로 의료법률금융 등 분야에 특화돼 성능을 정교하게 끌어올린 AI를 말합니다. 처리하는 데이터가 적은 만큼 훈련 시간과 운영 비용 전력 소모량 등이 적어 경제적입니다.
.
MS는 그동안 협업 관계인 오픈AI의 거대 언어 모델 인 GPT를 활용해 인공지능 서비스를 해왔습니다. LLM은 천문학적 용량의 데이터를 학습하고 생성하는 역할을 하는 모델로 생성형 AI 개발의 기반이 됩니다. 만능 AI로 불리는 GPT는 생성형 AI가 학습추론을 할 때 데이터를 서로 연결해 주는 파라미터 가 1조개 정도 됩니다. 반면 파이3 비전의 파라미터는 42억개에 불과합니다. 파라미터가 적으면 처리하는 데이터 수가 줄어 제공하는 정보의 양도 적지만 운영 비용은 크게 낮아집니다. MS는 파이3 비전은 시각 추론 작업 표나 차트 이해 작업에 특화한 모델이라며 비슷한 성능을 지닌 다른 모델 대비 비용은 10분의 1에 그친다고 밝혔습니다. 업계 관계자는 모든 자동차를 스포츠카처럼 고성능으로 만들지 않고 용도에 따라 경차소형차대형차도 생산하듯이 생성형 AI도 가성비에 맞는 저용량 모델이 나오는 것이라고 말했습니다.
거대 언어 모델 개발 질주에 나섰던 빅테크들이 올해 들어 잇따라 sLLM 모델을 내놓으며 생성형 AI 시장 공략에 나서고 있습니다. sLLM은 말 그대로 소형화하고 경량화한 거대 언어 모델을 말합니다. 기본 조 단위 파라미터를 갖는 기존 LLM과 달리 적게는 수십억 개 단위의 파라미터로 운영이 가능해 훈련 시간과 운영 비용 전력 소모량이 획기적으로 적은 게 특징입니다. MS구글메타까지 sLLM 경쟁올해 들어 글로벌 빅테크는 sLLM을 속속 출시하고 있습니다. MS가 파이3를 내놓은 데 앞서 지난달 메타는 파라미터 80억개의 라마3 앤스로픽은 방대한 양의 연구 논문 요약에 특화된 클로드3 하이쿠를 국내 기업 네이버는 하이퍼클로바X 대시를 내놨다. 이들은 공통적으로 파라미터가 수십억 개에 그친다는 특징이 있습니다. 이 때문에 비용은 훨씬 저렴하고 속도는 빠르다.
빅테크들이 sLLM 개발에 뛰어드는 건 수익성 때문입니다. LLM은 성능은 좋지만 개발에 천문학적 비용이 들고 사용처도 빅테크에 국한됩니다. 아직은 수익성이 떨어질 수밖에 없습니다. 하지만 sLLM은 스타트업들도 사용할 수 있게 비용을 낮췄다. 맛있는 감 활용 방법 그리고 효능 체크 파이낸셜타임스 는 비싼 비용을 우려하는 일반 기업들이 조금 더 쉽게 AI 도입을 할 수 있도록 하기 위한 빅테크들의 노력이라며 LLM을 구축하기 위해 수십억 달러를 쓴 빅테크들이 수익을 내기 위해 sLLM을 속속 내놓고 있다고 분석했습니다. 실제 sLLM은 LLM에 비해 비용이 크게 저렴합니다. FT에 따르면 100만 토큰 기준으로 LLM인 구글의 제미나이 1.
5 프로는 7달러 GPT-4o가 5달러의 비용이 든다. 예컨대 한 기업이 빅테크가 개발한 LLM을 활용해 서비스나 앱을 만들 경우 영 단어 기준 100만개의 답변을 얻을 때마다 이 돈을 빅테크에 지불해야 한다는 뜻입니다. 하지만 대부분의 sLLM은 비용이 100만 토큰 기준 1달러 미만입니다. 업계 관계자는 AI 시대에 맞춰 관련 서비스를 만들고 싶어도 막대한 비용 탓에 선뜻 도입을 꺼렸던 기업들 입장에선 싸고 가벼운 sLLM이 입문용으로 도전해볼 만한 것이라고 말했습니다. 수익성활용성에 강점sLLM은 수익성뿐 아니라 활용성 측면에도 강점이 있습니다. 작고 가볍기 때문에 클라우드 를 거치지 않고 기기 안에서 AI 서비스를 제공하는 온디바이스 AI를 구현할 수 있습니다. 실제 삼성전자는 올해 초 첫 AI 스마트폰 갤럭시S24를 내놓으며 구글의 sLLM 모델 제미나이 나노를 탑재했습니다.
애플도 올해 아이폰에 AI를 구동하기 위해 자체 sLLM을 개발하고 있는 것으로 알려졌습니다. 의료법률금융 등 각 기업이 필요한 특정 목적에 맞게 맞춤형으로 개발 가능하다는 것도 장점입니다. 국내에서는 KT가 기존 2100억개 이상의 파라미터를 가진 LLM 믿음을 70억~400억개 수준으로 경량화해 특정 분야에 제공할 계획입니다. 국내 AI 스타트업 업스테이지는 최근 sLLM 솔라미니를 출시했고 리걸테크 스타트업 로앤컴퍼니와 법률에 특화된 서비스를 개발하고 있습니다. ☞sLLM small Large Language Model의 약자. 오픈AI의 GPT나 구글의 제미나이처럼 방대한 양의 데이터를 학습해 모든 질문에 답하는 거대언어모델 과 달리 주로 의료법률금융 등 분야에 특화돼 성능을 정교하게 끌어올린 AI를 말합니다. 처리하는 데이터가 적은 만큼 훈련 시간과 운영 비용 전력 소모량 등이 적어 경제적입니다.
.
- 이전글Where Can You Find The Best Birth Injury Case Information? 24.05.27
- 다음글충돌 정치 이래도 되는 건가 24.05.27