Tech & Cert.

주요 기술과 인증

홈 · 제품소개 · 제품소개

제품1

제품2

제품3

PATENTS

보유 특허 기술

주제별 텍스트 분류 및 데이터셋 생성 방법 및 시스템

특허 번호: 10-2843407

책의 서지정보 및 목차를 결합하여 텍스트를 주제별로 세밀하게 자동 분류하고, 구조적 태깅을 통해 대형 언어 모델(LLM) 학습에 최적화된 고품질 데이터셋을 생성하는 방법 및 시스템.

 
주요 기능
  • 서지정보와 목차 데이터 수집 및 분석
  • 본문 영역 매핑 및 구조적 태그 자동 입력
  • 분류 코드 및 키워드 기반 주제 결정 및 레이블링
  • LLM 학습 최적화 데이터셋 구성 및 자동화된 검증

인공지능 문자인식 데이터셋 제작 방법 및 시스템

출원 번호: 2024-0139627

이미지 내의 텍스트 영역을 탐지하여  문자 인식을 수행한 결과를 사전에 매핑 저장된 텍스트 정보와 비교하여, 자동으로 라벨링 정보를 부여하고 데이터셋을 제작하는 방법 및 시스템.

 
주요 기능
  • 이미지 및 텍스트 정보의 자동 수집 및 매핑
  • 텍스트 영역에 대한 바운딩 박스 자동 지정
  • 문자 인식 결과와 저장된 텍스트 정보의 비교
  • JSON 및 XML 형식의 데이터셋 포맷 변환

문서 이미지의 구조 분석을 통한 자동 목차 인식 시스템

출원 번호: 2025-0123770

문서 이미지의 구조를 분석하고 전처리하여 자동 목차를 인식하여,  PDF 북마크 링크와 AI 학습용 구조화 데이터셋을 생성하는 시스템 및 방법.

 

 
주요 기능
  • AI 기반 스캔 문서의 구조 자동 분석
  • 스캔 이미지 노이즈 및 왜곡 자동 전처리
  • 목차 영역 자동 인식 및 TOC 추출
  • PDF 북마크 및 구조화 데이터(JSON/XML) 생성 및 저장

AI OCR의 할루시네이션 탐지 및 자동 교정 시스템

출원 번호: 2025-0164324

OCR 시스템이 제공하는 문자 단위 신뢰도를 분석하여 고신뢰도 문자를 앵커 포인트(Anchor Point)로 활용하고, LLM 기반 OCR의 할루시네이션 발생 영역을 실시간으로 탐지하고 자동 교정하는 시스템.

 
주요 기능
  • OCR 신뢰도를 활용한 앵커 포인트 설정
  • OCR 엔진별 변환 결과 비교
  • 신뢰도 점수 기반 할루시네이션 탐지
  • 교정 후 결과에 대한 품질 검증 및 재교정 모듈
CRETIFICATIONS

기업 인증 현황

중소기업확인서

벤처기업확인서

연구개발전담부서인정서

CRETIFICATIONS

ISO 국제 인증

ISO 9001:2015

품질경영시스템

ISO 14001:2015

환경경영시스템

ISO 27001:2022

정보보안경영시스템

ISO 27701:2022

개인정보보호

CRETIFICATIONS

저작권 등록

Works Image

Works TOC

Works PDF

Works OCR

PDF Analyzer

Works XML

Tag Manager

Works Redact

Works Rights

Works PMS

Infomation
디카이브 주식회사      |     사업자등록번호: 209-86-02308
서울특별시 금천구 가산디지털1로 168, C동 407호(가산동, 우림라이온스밸리)
TEL. 02-2291-7890     |     
FAX. 02-2291-1230​
E-mail: info@dkaiv.co.kr
© 2025 Dkaiv Co., Ltd. All rights reserved.
This is a staging environment