화합물 표현에 SMILES 표현이라고 있습니다. 예시인데요. 카페인을 표현하는 SMILES 표현식입니다. CN1C=NC2=C1C(=O)N(C(=O)N2C)C문제는 현재의 대형 언어 모델(LLM)이 이 구조식을 대할 때 발생합니다.인간 연구자는 이 문자를 보며 분자의 각도와 입체적인 연결 구조를 떠올리지만, LLM은 그저 나열된 문자열 그 자체로 인식합니다.이것은 모델의 지능 문제가 아니라, 텍스트 기반 학습이 가진 근본적인 구조적 한계입니다.똑같은 분자도 다르게 말하면 틀리는 이유최근 발표된 논문 "Beyond SMILES: Evaluating Agentic Systems for Drug Discovery"는 이 지점을 아주 정밀하게 타격합니다.구조적으로는 완벽하게 동일한 분자이지만, SM..