▲ⓒ
▲ BC카드가 금융 언어자료(말뭉치) 180만건을 무상으로 공개했다. ⓒ BC카드

BC카드는 국내 AI 경쟁력 강화를 위해 개발 단계에서 바로 사용 가능한 금융 언어자료(말뭉치) 180만건을 무상으로 공개했다고 27일 밝혔다.

말뭉치는 LLM(거대언어모델)을 통해 훈련되며, AI 개발 초기 단계에서부터 중요한 역할을 한다.

말뭉치는 인터넷에서 검색 가능한 자료를 모아 놓은 집합체로 LLM을 통해 사람처럼 설명할 수 있도록 훈련하는 데 사용된다.

개발 초기 단계에서부터 활용되는 말뭉치가 최종 결과물에 큰 영향을 미치는 만큼 말뭉치 제공 기업과 개인 역량(데이터 수집·가공 등)에 대한 중요도도 높아지고 있다.

BC카드는 국내 금융사 중 최초로 '기업정보조회업'을 획득한 데 이어 △데이터 전문기관 △마이데이터 △개인사업자 신용평가 △가명정보 결합전문기관 지정 등 정부 인가의 데이터 사업 5개 라이선스를 모두 보유하고 있다.

AI 경쟁이 치열한 상황에서 BC카드는 금융권에서 AI 개발을 지원할 최적의 기업으로 주목받고 있다.

AI 모델 허브 플랫폼인 허깅페이스에 따르면 영어 기반의 말뭉치는 전체 비중에서 70% 이상을 차지하지만 한글 기반 말뭉치 비중은 미미하다.

이에 BC카드는 한글 기반 말뭉치 확대를 위해 자료를 공개하고 지난해 공개한 'K-금융 특화 AI' 모델을 활용할 계획이다.

이를 통해 다양한 기업에서 AI 개발이 확산할 것으로 기대하며, 한국어 말뭉치가 폭발적으로 생성될 것으로 전망한다.

BC카드 조명식 상무는 "AI를 활용한 금융 서비스의 새로운 미래를 열기 위해 AI 업무를 전담해 수행하는 조직을 창설했다"며 "금융 특화 말뭉치를 통해 금융권과 국내 AI 경쟁력이 강화되기를 바란다"고 말했다.

저작권자 © 누구나 안심하고 살 수 있는 세상을 만드는 언론 세이프머니(SafeMoney) 무단전재 및 재배포 금지