티스토리 뷰

목차



    제미나이 라이브

    Gemini Live, 정말 유용한 음성봇일까? - 구글의 새로운 AI 음성봇 리뷰

    구글의 새로운 AI 음성봇인 Gemini Live를 사용한 후기를 공유하며, 이 기술이 실제로 얼마나 유용한지에 대해 깊이 있는 분석을 제공합니다.

    1. Gemini Live란 무엇인가?

    겨울이 다가오고, 구글의 AI 기술은 더욱 강력해지고 있습니다. 그런데, 여러분도 궁금하지 않으세요? 새로운 AI 음성봇인 Gemini Live가 과연 정말로 우리 생활에 유용할까요?

    1-1. Gemini Live의 기능

    Gemini Live는 구글의 최신 생성을 기반으로 한 모델인 Gemini 1.5 Pro와 1.5 Flash 위에 구축된 텍스트-음성 변환 엔진입니다. 이 모델은 생성된 텍스트를 소리내어 읽어주며, 대화 기록은 Android용 Gemini 앱의 Gemini Live UI에서 스와이프로 확인할 수 있습니다.

    1-2. 이전 버전과의 차이점

    구글 어시스턴트와 같은 이전의 AI 음성 상호작용과 비교했을 때, Gemini Live는 더 자연스럽고 자유로운 대화 경험을 제공합니다. 그러나, 이와 동시에 새로운 문제점을 도입하는 단점을 가지고 있습니다.

     

    2. 실제 사용 후기

    지난 한 주간 Gemini Live를 사용해보니, 이전의 AI 음성 상호작용보다 더 자유롭고 자연스러운 느낌을 받았습니다. 하지만 이와 동시에 몇 가지 새로운 문제도 발견했습니다.

    2-1. 느낌과 사용자 경험

    간단히 말해, Gemini Live는 ‘우르사’(Ursa)라는 이름의 중간 범위, 생동감 있는 음성을 선택했습니다. 이 음성은 전문 배우들과 협력하여 디자인된 10가지 목소리 중 하나로, 이전의 구글 어시스턴트 목소리보다 더 표현력이 있었습니다.

    그러나, 우르사를 포함한 모든 Gemini Live 음성은 좀 더 무덤덤한 톤을 유지하여, 어색한 느낌을 주지 않습니다. 이는 의도적인지 확실하진 않지만, 사용자들은 음성의 음조, 음색, 템포를 조절할 수 없어, Advanced Voice Mode에 비해 확실히 불리한 점이 있습니다.

    2-2. 대화 흐름과 자연스러움

    Gemini Live의 채팅 봇은 Advanced Voice Mode에서 들을 수 있는 웃음, 호흡, 소리치는 등의 표현력이 부족합니다. 오히려 공손하지만 무관심한 어시스턴트처럼 여러 대화를 관리하며, 특정 대화에 신경 쓸 여유가 없는 듯한 느낌을 줍니다.

     

    3. 문제점 및 단점

    Gemini Live를 사용할 때 몇 가지 주요 문제점이 눈에 띄었습니다. 특히, 기술의 기본 문제점을 해결하지 못한 채, 새로운 문제를 추가로 도입하는 점이 문제였습니다.

    3-1. 불일치와 환각

    Gemini Live는 대화 세션에서 이전 대화를 상당 부분 기억할 수 있지만, 사람, 장소, 사물에 대한 질문에서는 종종 환각을 일으켰습니다. 예를 들어, 뉴욕시에서 저렴하게 즐길 수 있는 활동을 물어봤을 때, 안내해준 장소들 중 일부는 사실과 달랐거나, 폐업한 장소도 포함되어 있었습니다.

    3-2. 제한된 기능과 기술 오류

    Gemini Live는 여전히 많은 기술적 문제도 가지고 있습니다. 특히 첫 시작부터 설정 과정이 복잡하고, 대화 도중 음성이 끊기는 현상이 빈번히 발생했습니다. 또한, 구글의 텍스트 기반 Gemini 챗봇과 달리 많은 통합 기능이 지원되지 않았습니다.

     

    4. 종합적인 평가

    전체적으로 Gemini Live는 prototype이라는 느낌을 지울 수 없습니다. $20의 월 요금제를 지불해야 사용할 수 있지만, 현재로서는 텍스트 기반 Gemini 경험보다 큰 장점이 없습니다. 특히 이미지와 실시간 비디오 해석 기능이 추가되기 전까지는 큰 유용성을 기대하기 어렵습니다.

     

    결과적으로, 과연 Gemini Live가 정말 유용한 음성 봇인지에 대한 답은 부정적일 수밖에 없습니다.