기업 내 기술개발(R&D) 전담 조직은 기업의 장기적인 기술 전략을 수립하고 신제품 및 서비스를 개발하며 핵심 기술 연구 및 혁신을 주도하여 기업의 기술 경쟁력을 강화하는 역할을 수행하고 있음
기술 트렌드가 빠르게 변화하고 있으며, 다수의 경쟁 기업 및 기술의 출현으로 관련 기술 논문, 특허, 산업 보고서 등의 방대한 문서 분석에 대한 필요성이 높아지고 있음
이에 고객사에서는 자사 연구 관련 논문, 특허, 표준 규격 문서들을 DB화하고, LLM(Large Language Model)을 기반으로 자연어 질의응답 할 수 있는 연구 지원 플랫폼을 구축하고자 함
Approach
논문, 특허, 표준 규격 문서들에 대한 분석은 단순 RAG(Retrieval Augmented Generation)로 정확한 답변이 어렵기 때문에 특성에 따른 LLM 활용 전략 수립, 모델링 및 테스트 반복 수행, LLM 외 보조적인 기능 구현(검색모듈 별도 구현, OCR 도입 등)이 요구됨
문서 내용에 대한 Q&A의 경우 예상 질문들의 의도(Intent)와 개체(Entity)를 파악하고, 필요에 따라 NLU(Natural Language Understanding) 엔진 적용을 고려함
별도 검색모듈을 통해 문서를 선별하고 문서 전처리 및 Embedding, DB 적재 등을 위한 항목 정의함
사용자 질문에 대한 답변과 함께 관련 표나 그림이 포함된 원문 페이지를 뷰어로 함께 보여주는 방안 검토함
Results
논문/특허 Q&A: 특정 키워드에 대한 문서 검색, 문서 내용 간 유사점 및 차이점 분석, 서지 정보를 활용한 메타 데이터 DB 구성으로 관련 기술동향에 대해 신속하고 정확한 파악이 가능함
표준 규격 Q&A: KS, IEC, IEEE 등 표준 규격 문서 기반 정보 추출 및 요약으로 신속하고 정확한 정보 제공이 가능하고, 표준화된 지침 적용으로 프로세스 개선 및 생산성 향상이 가능함