티스토리 뷰
목차
개요
AI 모델은 다양한 작업을 수행할 수 있는 능력을 보여주었지만, 어떤 작업을 수행하는 것이 실제로 유용할까요? 아마도 우리가 선호하는 것은 단조로운 작업일 것입니다. 연구와 학문 계에는 그러한 단조로운 작업이 많습니다. Reliant는 현재 피로에 지친 대학원생과 인턴의 특기로 남아있는 시간 소모적인 데이터 추출 작업을 전문으로 하려고 합니다.
과학 연구에 AI가 필요한 이유
“AI로 할 수 있는 최고의 일은 인간의 경험을 개선하는 것입니다: 단조로운 노동을 줄이고 사람들이 자신에게 중요한 일을 할 수 있게 하는 것입니다,” 라고 CEO Karl Moritz가 말했습니다. 그는 공동 창립자인 Marc Bellemare와 Richard Schlegel과 함께 연구계에서 다년간 일했으며, 문헌 검토가 “단조로운 노동”의 가장 일반적인 예 중 하나임을 밝힙니다.
모든 논문은 이전 및 관련 작업을 인용하지만, 수많은 과학의 바다에서 이러한 소스를 찾는 것은 쉽지 않습니다. 그리고 체계적 검토와 같은 일부 경우에는 수천 개의 데이터를 인용하거나 사용합니다.
Reliant의 해결책
Tabular의 기능과 특징
Reliant의 핵심 제품인 Tabular는 LLM(LLaMa 3.1)을 기반으로 하고 있지만, 다른 독점 기법으로 보강되어 상당히 효율적입니다. 앞서 언급한 수천 개의 연구 데이터를 추출하는 작업을 무오류로 수행했다고 합니다.
그 의미는 이렇습니다: 수천 개의 문서를 입력하고 이 문서들에서 저, 그것, 다른 데이터를 추출하라고 지시하면, Reliant가 이를 철저히 조사하여 해당 정보를 찾아줍니다. 이 데이터는 완벽하게 레이블이 지정되고 구조화되어 있을 수도 있고 (훨씬 더 가능성이 높은 것은) 그렇지 않을 수도 있습니다. 그런 다음 원하는 모든 분석과 함께 깔끔한 UI에 데이터를 넣어 개별 사례를 깊이 파고들 수 있습니다.
사용자 경험 향상
Moritz는 “사용자들이 한 번에 모든 데이터를 작업할 수 있어야 하며, 우리는 그들이 그곳에 있는 데이터를 수정하거나 데이터에서 문헌으로 이동할 수 있도록 기능을 구축하고 있다”며, “우리는 사용자가 주의를 기울여야 할 곳을 찾는 것을 돕는 역할을 한다고 본다”고 말했습니다.
이러한 맞춤형 AI 응용 프로그램은 디지털 친구처럼 화려하지는 않지만 거의 확실히 더 실현 가능성이 높으며, 여러 고도로 기술적인 영역에서 과학을 가속화할 수 있습니다. 투자자들은 이를 주목하여 $11.3백만의 초기 자금을 지원했습니다. Tola Capital과 Inovia Capital이 주도했으며, 엔젤 투자자 Mike Volpi도 참여했습니다.
기술적 도전과 투자
고성능 컴퓨팅의 필요성
어떤 AI 응용 프로그램과 마찬가지로, Reliant의 기술도 매우 많은 컴퓨팅 자원을 필요로 합니다. 그래서 회사는 큰 제공업체에서 임대하는 대신 자체 하드웨어를 구입했습니다. 하드웨어 내재화는 리스크와 보상을 모두 제공합니다: 이 비싼 기계를 자급자족하게 만들어야 하지만, 전용 컴퓨팅으로 문제 공간을 파헤칠 수 있는 기회를 얻습니다.
Moritz는 “제한된 시간 내에 좋은 답을 내놓는 것이 매우 어려운 것을 발견했습니다”라고 설명했습니다. 예를 들어, 과학자가 시스템에 백 편의 논문에 대한 새로운 추출 또는 분석 작업을 수행하도록 요청하는 경우, 이를 신속하게 또는 잘 수행할 수 있지만 둘 다 동시에 수행하기는 어렵습니다. 이 경우 사용자가 어떤 질문을 할지 예측하여 미리 답변을 찾아내거나 이에 상응하는 작업을 수행해야 합니다.
Bellemare는 “많은 사람들이 같은 질문을 하기 때문에 우리가 그들이 질문하기 전에 답을 찾을 수 있다”고 말하며, “우리는 100페이지의 텍스트를 더 다루기 쉬운 다른 것으로 증류할 수 있습니다.”라고 덧붙였습니다.
도메인 특화와 애매모호성 해결
미리 추출 작업을 함으로써 모델이 다양한 과학적 도메인에서 발생하는 불가피한 애매성과 가정을 해결할 수 있는 시간을 제공하는 것입니다. 하나의 지표가 "다른 것을 나타내는" 경우, 이는 제약 분야에서 임상 실험에서와 동일한 의미를 가질 수 없습니다. 뿐만 아니라, 언어 모델은 특정 질문을 어떻게 요청하느냐에 따라 다른 출력을 제공하는 경향이 있습니다. 그래서 Reliant의 역할은 애매모호성을 확실성으로 바꾸는 것입니다 - “그리고 이는 특정 과학이나 도메인에 투자할 의지가 있을 때만 가능합니다”라고 Moritz는 언급했습니다.
시장에서의 위치
경쟁사와의 비교
회사는 신뢰성이 입증되기 전까지 더 야심적인 시도를 하기보다는 기술이 자체 비용을 충당할 수 있는지 먼저 확인하는 것이 우선입니다. “흥미로운 진전을 이루기 위해서는 큰 비전을 가져야 하지만 구체적인 것부터 시작해야 한다”고 Moritz는 말했습니다. “스타트업 생존 관점에서 볼 때 우리는 이익을 추구하는 회사에 집중합니다. 그들은 우리의 GPU 비용을 지불할 돈을 주기 때문입니다. 우리는 고객에게 손해를 보면서 이를 판매하지 않습니다.”
OpenAI와 Anthropic과 같은 회사들이 데이터베이스 관리와 코딩과 같은 더 구조화된 작업을 처리하는 데 더 많은 돈을 쏟아붓고 있거나 Cohere와 Scale과 같은 구현 파트너들에게 압박을 받는다고 예상할 수 있습니다. 하지만 Bellemare는 낙관적이었습니다: “우리는 이러한 흐름에 맞춰 구축하고 있습니다 - 우리의 기술 스택이 개선될수록 우리에게 더 좋습니다. LLM은 우리의 여덟 개의 대형 머신러닝 모델 중 하나일 뿐이며, 나머지는 전적으로 우리에게 독점적이고 우리만의 데이터로 만들어졌습니다.”
AI와 과학 연구의 미래
바이오테크와 연구 산업이 AI 중심으로 전환되는 것은 확실히 시작에 불과하며, 앞으로 몇 년 동안 상당히 패치워크될 가능성이 큽니다. 하지만 Reliant는 강력한 시작점을 찾은 것으로 보입니다.
Moritz는 “만약 당신이 95% 해결책을 원하고 가끔 고객에게 사과하는 것을 꺼리지 않는다면, 그건 좋은 것입니다,”라며 “우리는 정확성과 리콜이 정말 중요하고, 실수가 정말 큰 문제인 곳에서 일합니다. 솔직히 말해서, 그걸로 충분합니다. 나머지는 다른 사람들에게 맡기겠습니다.”라고 말했습니다.