DalKom.ai
← News 목록으로
ainewsxanthropicai

New on the Anthropic Engineering Blog: In evaluating Claude Opus 4.6 on BrowseComp, we found cases where the model recognized the test, then found and decrypted answers to it—raising questions about eval integrity in web-enabled environments. Read more:

[X] AnthropicAI 관련 핵심 내용을 짧게 정리한 기사입니다. · New on the Anthropic Engineering Blog: In evaluating Claude Opus 4.6 on BrowseComp, we found cases where the model recognized the test, then

한줄 요약: [X] AnthropicAI 관련 핵심 내용을 짧게 정리한 기사입니다. 원문 링크: https://x.com/AnthropicAI/status/2029999833717838016

핵심 내용: 기능 변경 포인트와 활용 관점을 중심으로 확인할 수 있습니다.

원문 보기 ↗