클로드 리서치가 압도적인 이유
관련 정보를 최대한 많이 수집하고 싶을 때는 클로드 리서치 기능이 압도적으로 좋다.
3사의 리서치 기능을 업무용으로 본격적으로 써본 결과, 특정 도메인에서 여러 조건을 충족하는 데이터셋을 최대한 많이 수집하라는 명령에 대해 각각 이렇게 동작했다.
-
OpenAI ChatGPT 5 Pro 리서치 모드는 30개 내외 출처를 살펴보고 20개 내외 데이터셋을 목록화했다.
-
구글 Gemini 2.5 Flash 리서치 모드는 50개 내외 출처를 살펴보고 15개 내외 데이터셋을 기반으로 리포트를 생성했다. Flash 모델임에도 처음 결과는 꽤 놀라운 수준이었다. 목적만 듣고 데이터셋 구축 로드맵까지 작성해줬는데 퀄리티가 좋았다. 다만 시키지 않은 것까지 하는 것에 대해서는 호불호가 갈릴 듯하다.
-
클로드 Sonnet 4.5 리서치 모드는 무려 858개의 출처를 검토하고 100여 개의 데이터셋을 리스트업했다. 관계없는 데이터셋을 포함해 수만 늘린 것이 아니라 프롬프트에 명시한 조건의 일부를 만족하는 것들을 잘 찾아줬다. 3사 리서치를 프롬프트를 개선하며 여러 번 돌려 찾았던 데이터셋 상당수를 포함하고 있었다. 가장 오랜 시간인 40분을 소요했지만 가장 에이전틱하게 동작했다.
Related
LLM JSON 출력의 현실적 문제
LLM의 JSON 아웃풋이 가끔 깨지는 문제와 이를 위한 후처리 도구 소개. 포맷 지시를 마지막 유저 메시지에 넣는 것이 실용적 팁이다.
Stateful API가 기대되는 이유
OpenAI Stateful API 루머에 대한 기대. 대화 이력을 유지하면서 연속 호출하는 방식이 가능해지면 결과 품질이 크게 올라갈 수 있다.
LLM에게 자아를 부여하지 마라
카파시는 LLM을 자아를 가진 존재가 아니라 시뮬레이션 엔진으로 대해야 한다고 조언한다. 이 관점은 AI 활용법을 넘어 AI를 존재로 인식하는 문제의 해결 시작점이 될 수 있다.