Tech & Cert.
주요 기술과 인증
홈 · 제품소개 · 제품소개
PATENTS
보유 특허 기술
주제별 텍스트 분류 및 데이터셋 생성 방법 및 시스템
특허 번호: 10-2843407
책의 서지정보 및 목차를 결합하여 텍스트를 주제별로 세밀하게 자동 분류하고, 구조적 태깅을 통해 대형 언어 모델(LLM) 학습에 최적화된 고품질 데이터셋을 생성하는 방법 및 시스템.
주요 기능
- 서지정보와 목차 데이터 수집 및 분석
- 본문 영역 매핑 및 구조적 태그 자동 입력
- 분류 코드 및 키워드 기반 주제 결정 및 레이블링
- LLM 학습 최적화 데이터셋 구성 및 자동화된 검증
인공지능 문자인식 데이터셋 제작 방법 및 시스템
출원 번호: 2024-0139627
이미지 내의 텍스트 영역을 탐지하여 문자 인식을 수행한 결과를 사전에 매핑 저장된 텍스트 정보와 비교하여, 자동으로 라벨링 정보를 부여하고 데이터셋을 제작하는 방법 및 시스템.
주요 기능
- 이미지 및 텍스트 정보의 자동 수집 및 매핑
- 텍스트 영역에 대한 바운딩 박스 자동 지정
- 문자 인식 결과와 저장된 텍스트 정보의 비교
- JSON 및 XML 형식의 데이터셋 포맷 변환
문서 이미지의 구조 분석을 통한 자동 목차 인식 시스템
출원 번호: 2025-0123770
문서 이미지의 구조를 분석하고 전처리하여 자동 목차를 인식하여, PDF 북마크 링크와 AI 학습용 구조화 데이터셋을 생성하는 시스템 및 방법.
주요 기능
- AI 기반 스캔 문서의 구조 자동 분석
- 스캔 이미지 노이즈 및 왜곡 자동 전처리
- 목차 영역 자동 인식 및 TOC 추출
- PDF 북마크 및 구조화 데이터(JSON/XML) 생성 및 저장
AI OCR의 할루시네이션 탐지 및 자동 교정 시스템
출원 번호: 2025-0164324
OCR 시스템이 제공하는 문자 단위 신뢰도를 분석하여 고신뢰도 문자를 앵커 포인트(Anchor Point)로 활용하고, LLM 기반 OCR의 할루시네이션 발생 영역을 실시간으로 탐지하고 자동 교정하는 시스템.
주요 기능
- OCR 신뢰도를 활용한 앵커 포인트 설정
- OCR 엔진별 변환 결과 비교
- 신뢰도 점수 기반 할루시네이션 탐지
- 교정 후 결과에 대한 품질 검증 및 재교정 모듈
CRETIFICATIONS
기업 인증 현황
중소기업확인서
벤처기업확인서
연구개발전담부서인정서
CRETIFICATIONS
ISO 국제 인증
ISO 9001:2015
품질경영시스템
ISO 14001:2015
환경경영시스템
ISO 27001:2022
정보보안경영시스템
ISO 27701:2022
개인정보보호
CRETIFICATIONS