Skip to content

SKT-AI/A.X-4.0

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

9 Commits
 
 
 
 
 
 
 
 

Repository files navigation

A.X Logo

🤗 Models | 💬 Chat | 📬 APIs (FREE!) | 🖥️ Github

A.X 4.0: 기업용 한국어 특화 대규모 언어 모델

🇺🇸 View English README

SK텔레콤이 한국어 처리 능력과 기업 활용성을 높인 대규모 언어 모델(LLM) A.X 4.0 (에이닷엑스 4.0)을 2025년 4월 30일에 출시하였습니다. A.X 4.0은 오픈소스 모델인 Qwen2.5에 방대한 한국어 데이터를 추가로 학습시켜 국내 비즈니스 환경에 최적화된 성능을 발휘합니다.

A.X 4.0, 무엇이 다른가요?

  • 뛰어난 한국어 실력: 대표적인 한국어 능력 평가 벤치마크인 KMMLU에서 78.3점을 기록하여, GPT-4o(72.5점)보다 우수한 성능을 보였습니다.
  • 높은 한국 문화 이해도: 한국어 및 한국 문화 벤치마크인 CLIcK에서도 83.5점을 획득해, GPT-4o(80.2점)보다 더 높은 이해도를 입증했습니다.
  • 효율적인 토큰 처리: 동일한 한국어 텍스트를 입력해도 A.X 4.0보다 GPT-4o가 약 1.5배 많은 토큰을 사용합니다.
  • 방대한 정보 처리: 최대 131,072 토큰에 이르는 긴 문서나 대화도 한 번에 이해하고 처리할 수 있습니다.
  • 도메인 지원: 코딩, 제조업 등 전문 지식이 필요한 분야에서도 활용할 수 있도록 기본 성능을 강화했습니다.
  • 배포 옵션: 720억 개(72B) 매개변수를 갖춘 표준 모델과 70억 개(7B) 매개변수의 경량 모델로 제공되며, 기업 내부 서버에 직접 설치(온프레미스)할 수 있어 데이터 보안에 대한 걱정을 덜 수 있습니다.

핵심 기술은?

한국어 특화 토크나이저 적용

한국어의 고유한 특성을 잘 이해하도록 최적화된 토크나이저를 사용합니다. 이 토크나이저는 한국어의 다양한 표현과 문맥을 효과적으로 파악하도록 설계되었습니다. 내부 테스트 결과, 같은 한국어 문장을 입력했을 때 GPT-4o보다 A.X 4.0이 33.3% 효율적으로 토큰을 사용합니다.

이는 실제 사용 환경에서 다음과 같은 장점이 있습니다.

  • 같은 조건이라면 대략 1.5배 더 많은 한국어 정보를 처리할 수 있습니다.
  • 토큰 수가 줄어들어 처리 비용을 34% 정도 절감할 수 있습니다.
  • API를 호출할 때 토큰 사용량에 따라 비용이 책정되는 구조에서 유리합니다.

특히 문서 요약이나 검색 증강 생성(RAG) 등 긴 글을 다루는 기업 환경에서, 토큰 효율성은 운영 비용을 크게 절감하는 데 기여합니다.

한국어 이해와 생성 능력을 향상시키는 학습 데이터 구성

A.X 4.0에 사용된 학습 데이터는 다음과 같은 특징을 갖습니다.

  • 고품질의 한국어 자료: 웹에서 추출한 고품질 데이터, 전문 서적, 합성 데이터를 포함한 대규모 고품질 데이터셋을 활용했습니다.
  • 체계적인 데이터 분류: 다양한 분야에서 균형있게 높은 성능을 발휘하도록 주제별로 분류된 데이터셋을 구성했습니다.
  • 균형 잡힌 언어 분포: 한국어 42%, 영어 51%, 기타 언어 및 코드 7%로 구성해 언어 간 균형을 유지했습니다.

이러한 데이터 구성은 모델이 한국어의 다양한 표현과 미묘한 문맥까지 깊이 이해하도록 돕습니다.

효과적인 학습 방법

학습은 다음과 같은 단계를 거쳤습니다.

  • 한국어 토크나이저 적응(Tokenizer Aligning): 기존 토크나이저를 한국어 토크나이저로 교체한 후 기존 모델과 정합했습니다.
  • 지속적 사전학습(Continued Pre-Training, CPT): 한국어 이해력과 전반적인 언어 능력을 높이기 위해 대규모 한국어 코퍼스를 활용해 추가 학습했습니다.
  • 지도 미세조정(Supervised Fine-Tuning, SFT): 다양한 지시나 질문에 더욱 정확하게 응답할 수 있도록, 고품질의 한국어 데이터셋을 활용해 지도학습 방식으로 미세조정했습니다.
  • 강화학습(Reinforcement Learning from Human Feedback, RLHF): 인간 선호에 부합하는 응답을 생성할 수 있도록, 실제 사용자의 피드백을 반영해 추가로 성능을 개선했습니다.

이 방식은 처음부터 모델을 새로 학습시키는 것보다 자원을 효율적으로 사용하며, 한국어 데이터를 집중적으로 활용해 특정 분야의 성능을 빠르게 높일 수 있다는 장점이 있습니다.

벤치마크 측정 결과

A.X 4.0과 더불어 추론형 모델 A.X 4.1의 주요 벤치마크 결과를 간략히 비교하면 다음과 같습니다.

A.X 4.0 (지식형 모델)

평가지표 측정 영역 A.X 4.0 (72B) GPT-4o Qwen3 (235B MoE)
KMMLU 한국어 전문 지식 이해 78.3 72.5 70.6
CLIcK 한국 문화 맥락 이해 83.5 80.2 77.9
Ko-IFEval 작업 지시 수행 정확도 78.0 75.4 77.7
평균 79.9 76.0 75.4

A.X 4.1 (추론형 모델)

평가지표 측정 영역 A.X 4.1 (72B) DeepSeek-R1 (671B MoE) DeepSeek-R1-0528 (671B MoE)
MMLU 글로벌 전문 지식 이해 88.0 90.8 92.0
KMMLU 한국어 전문 지식 이해 73.3 76.1 70.4
Ko-IFEval 작업 지시 수행 정확도 77.0 77.4 74.5
CLIcK 한국 문화 맥락 이해 79.9 85.3 81.5
MATH500 문제 해결 및 논리적 추론 96.5 97.3 98.3
GPQA 전문지식 기반 정밀 추론 67.5 71.5 81.0
평균 80.4 83.1 83.0

어디에 활용할 수 있을까요?

A.X 4.0은 다양한 기업 업무에 활용될 수 있습니다.

  • 높은 한국어 성능을 바탕으로 업무 문서 작성을 보조할 수 있습니다.
  • 대량의 한국어 기업 문서를 신속하게 검색하고 핵심 내용을 요약할 수 있습니다.
  • 데이터 유출에 민감한 기업도 안심하고 사용할 수 있도록 내부망 설치를 지원합니다.

어떻게 사용할 수 있나요?

A.X 4.0은 다음과 같은 방식으로 제공될 예정입니다.

  • API 서비스

    • 사용량에 따라 비용을 내는 합리적인 요금제를 제공합니다.
    • 주요 개발 언어로 바로 사용할 수 있도록 다양한 예제 코드를 제공합니다.
  • 설치형 배포

    • 보안이 중요한 산업 분야를 위해 기업 내부 인프라에 직접 설치할 수 있는 방식입니다.
    • 양자화 기술을 적용하여 하드웨어 요구 사항에 최적화된 배포를 준비하고 있습니다.
  • 혼합형

    • 필요에 따라 내부 설치와 API 서비스를 함께 사용하는 방식입니다.
    • 기업 환경에 최적화된 구성과 맞춤형 서비스를 제공하기 위해 귀사와 협의할 준비가 되어 있습니다.

기술 지원은 어떻게 이루어지나요?

A.X 4.0의 기술 지원은 다음과 같이 제공할 계획입니다.

  • 기술 문의: 모델 활용에 대한 기술적인 질문에 답변해 드리는 채널을 운영할 예정입니다.
  • 적용 가이드: 특정 비즈니스 영역에 모델을 효과적으로 적용하는 방안을 함께 논의합니다.
  • 개발자 자료: 상세한 기술 문서와 다양한 예제 코드를 제공할 준비를 하고 있습니다.
  • 정기 업데이트: 모델 개선 사항 등 관련 정보를 정기적으로 전달해 드립니다.

앞으로의 개발 계획은?

SK텔레콤은 안정적인 개발 인프라를 기반으로 A.X 모델을 지속적으로 발전시켜 나갈 계획입니다. 특히 한국어 환경에서의 코드 작성 지원 기능을 적극적으로 연구하고 있습니다. 한국어로 작성된 주석이나 문서를 이해하고, 국내 기업 환경에 최적화된 코드를 생성하는 기능은 국내 개발자들의 생산성을 크게 향상시킬 것입니다.

  • A.X 4.1 (2025년 상반기): 추론(reasoning)형 모델

    • 수학 문제 해결과 코드 개발 능력을 강화하여 복잡한 질문에도 여러 단계를 거쳐 답을 찾을 수 있도록 합니다.
    • 바이브 코딩 데이터를 활용해 개발자 지원 기능을 고도화합니다.
  • 향후 모델 개발 방향 (2025년 하반기 이후):

    • 코딩 능력과 특정 산업(예: 제조업, 금융 등) 전문성을 더욱 강화합니다.
    • MCP (Model Context Protocol)와 같은 방식을 도입하고 스스로 작업하고 합리적 판단을 내릴 수 있는 에이전트형 모델을 개발합니다.
    • MoE (Mixture of Experts) 등의 최신 아키텍처를 효율적으로 적용합니다.

마무리하며

A.X 4.0은 강력한 한국어 처리 능력을 가진, 기업 환경에서의 활용성에 초점을 맞춘 언어 모델입니다. 이 모델을 통해 국내 기업들이 자체 환경에서 AI 기술을 보다 쉽게 활용할 수 있는 새로운 선택지를 제공하고자 합니다.

뛰어난 한국어 처리 효율성, 데이터 보안을 고려한 설계, 그리고 로컬 환경에서의 운영 가능성 등을 통해 국내 기업 환경에 가장 적합한 AI 도입을 지원하겠습니다.

더 자세한 정보가 필요하시거나 궁금한 점이 있으시면 아래 연락처로 편하게 문의해 주세요.

연락처: [email protected]

About

SKT A.X LLM 4.0

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published