리테일매거진
통권 501호

2017년 11월호

미리 보는 2018년 소매경기

비즈 인사이트
2017년 9월호
새로운 유통전쟁의 시작 | ⑨ 우리 삶에 가까이 있는 인공지능
보고 듣고 말하는 AI
‘감정 로봇’ 시대 열린다

인공지능 비서 춘추전국시대에 AI의 음성 인식률은 갈수록 높아지고 있으며, 컴퓨터 눈은 이미지 인식에, 귀는 인공지능 스피커나 챗봇에 쓰이고 있다. AI 기술은 빠른 속도로 진화하고, 그 진화의 속도보다 더 빠르게 우리의 일상을 파고들고 있다. 이제 영화보다 더 영화 같은 AI 기술을 현실에서 마주할 날이 머지않았다.

아직 사람들은 알파고가 이세돌과의 바둑 대전에서 이겼다는 사실만 알고 있을 뿐 피부에 와 닿을 만큼 인공지능을 느끼지 못한다. 그러나 우리가 알지 못하는 사이 많은 컴퓨터 프로그램들의 머신러닝 알고리즘은 기존에 통계적이거나 기계적으로 짜여있던 로직들을 대체해가고 있다.
사람이 생각하고 느끼며, 학습하고 행동하는 것을 인공지능 기반의 컴퓨터와 기계가 구현하고 있는 것이다. 사람이 하던 일을 훨씬 효율적이고 편리하게 만드는 인공지능은 이미 우리 삶에 가까이 와있다.

사람 말귀 ‘척척’…인공지능 비서 등장
인공지능이 우리 일상에 파고든 사례 몇 가지를 보면, 가장 먼저 음성인식 서비스를 꼽을 수 있다. 예를 들어, 애플의 아이폰에는 ‘시리(Siri)’라는 인공지능 기반의 음성인식 서비스가 있다. 인공지능 비서인 시리에게 ‘지금 몇 시지’, ‘아내에게 전화 좀 걸어줄래’, ‘오늘 날씨는 어때’라고 물으면 시리가 알아서 정보를 찾아 대답해준다. 운전 중 전화를 하거나, 찾는 곳의 위치를 확인할 때 유용하게 쓸 수 있다.
시리의 핵심 서비스는 음성인식인데 각기 다른 억양과 발음, 말버릇을 가진 사람들의 말을 명확히 알아듣고 그 의미를 파악하는 작업은 복잡하다. 여기서 핵심 기술은 ‘STT(Speech To Text ; 음성인식 엔진)’라고 불리는 과정을 통해 음성 메시지를 텍스트로 변환하는 것이다. 텍스트로 변환한 후에는 TA(Text Analysis ; 텍스트 분석)로 그 문장의 문맥을 이해해야 한다. 이는 구글이나 네이버 같은 포털에서 키워드 위주의 검색 기능으로 단어 하나하나에 대한 정보를 찾아주는 수준과 다르다. 문장 전체를 이해하고 그 문맥에 맞는 대답을 해주는 일은 어렵지만, 음성인식 비서 정도라면 문장의 의미를 알고 있어야 한다.
인공지능의 머신러닝 알고리즘으로 인해 STT 기술은 그 성능이 크게 개선됐다. 예를 들어 ‘좋다라는 음성이 ‘좋다’라는 의미의 단어다’라는 사실을 기계에게 학습시키려면 엄청나게 많이 분절된 음성 파일과 단어 세트의 매칭 작업을 거쳐야 한다. ‘좋다’는 이음절의 짧은 단어이지만 남자·여자, 어른·아이, 억양이나 사투리에 따라 들리는 음절의 파장 특성이 다양하다. 각기 다른 이들이 내는 음성을 컴퓨터가 모두 ‘좋다’라는 단어로 인식하려면 수많은 데이터를 지속 연결시켜주는 방법밖에 없다. 그런데 머신러닝을 통해 수만 개에 달하는 음성파일 및 음절을 연결시켜주는 학습이 가능해졌다. 이를 통해 애플이 아이폰의 시리를 선보일 수 있게 된 것이다. 이렇게 기계가 사람의 말을 알아듣기 시작한 것이 인공지능의 가장 초보단계다.

...기사전문보기
  정기구독신청하기
목록으로 가기