- 도로명 주소
- 서울 용산구 한강대로40길 18
- 우편번호
- 04386
- 영문주소
- 18 Hangang-daero 40-gil, Yongsan-gu, Seoul
- 연락처
-
02-794-5333
(주)디엠티랩스의 전체 정보
- 기업개요 및 핵심역량(요약)
- 가. 기업 개요디엠티랩스는 2018년 2월에 설립된 인공지능(AI) 기반 다국어 음성 언어 처리 전문업체입니다. 자연어처리 기반의 인공지능 기술 개발 및 응용사업으로 다국어 통역 및 번역, 언어 데이터 DB 구축, 데이터 처리 SW 개발, 음성언어 기술 개발을 꾸준히 진행하고 있습니다.1) 클라우드 기반 데이터 구축 및 가공 플랫폼 서비스2) 12개 국어 양방향 인공지능 자동번역 기술 솔루션 제공3) 인공지능 기반 자동번역, 음성인식, 문자인식 클라우드 서비스 제공4) 다양한 분야 대화 데이터 구축 및 대화 지식 가공 서비스 제공5) 문서 영역 인식 기반 메타데이터 추출 기술 제공6) 음성 전사 및 영상 자막 번역 및 생성 서비스 제공7) 번역 전문 플랫폼 운영8) 다국어 관광 해설 서비스 앱9) 다국어 전시/축제/행사 정보 제공 서비스 앱나. 핵심 역량1) 데이터 구축, 가공, 검수에 필요한 2,000여 명의 전문적인 프리랜서를 보유2) 전문적인 인력으로 다국어 음성, 대화, 번역 데이터 구축 및 가공 서비스 제공3) 6개 국어(한, 중, 영, 일, 불, 독) 간의 전문 번역(텍스트, 서식, 자막) 서비스 제공4) 자체 개발 클라우드 플랫폼 보유 및 이를 이용한 데이터 구축 서비스 제공5) 12개 국어 양방향 인공지능 자동번역 기술 보유 및 도메인별 번역 솔루션 제공6) 음성/영상 처리 및 음성 자동 전사 및 자막 번역 및 생성 도구 보유
- 기업한글명
- (주)디엠티랩스
- 도로명주소
- 서울특별시 용산구 한강대로40길 18 (한강로2가,다이빌딩)
- 등록일
- 2025-02-07
- 링크(URL)
- https://kdata.or.kr/datavoucher/is/selectPortalFileDetail.do?rcpnYear=2025&brno=3338600904&sprnSctrCd=P01014002&prdcId=&sprnDsncCd=P11014001
- 보유솔루션(요약)
- 1) 보유 기술 및 연구개발 역량 기술 분야 보유 기술 대표 성능 문서 수집 200+ 웹사이트 동시 수집 기술 및 docker 기반 동적 노드 할당 관리 기술 색인 및 검색 기가 바이트 단위 한중일영 문서 색인 및 검색 기술 텍스트 마이닝 PDF 학술논문 메타데이터 및 전문 추출 기술 93% 정확률 다국어 자동번역 8개 국어 도메인/분야별 특화 자동번역 기술 한중 일반 BLEU: 0.53, 한중 특허 BLEU: 0.41, 한영 일반 BLEU: 0.38, 한영 특허 BLEU: 0.33 음성 인식 딥러닝 기반 다국어 음성인식 솔루션으로 다양한 도메인에 대한 음성 명령어 인식 및 연속발화 인식 기술 WER 13%, CER 9% 이내 이미지 인식 한국어 및 중국어 이미지 인식 기술 한: 89%; 중: 94% 기타 고품질 학습데이터를 기반으로 한 신경망 음성합성 기술 한국어 형태소분석 기술 성능 Precision 95.6%, 개체명 인식 기술 성능 Precision 98.1% 2) 특허 및 프로그램 등록 현황 - 특허 출원 및 등록 현황 발명의 명칭 등록번호 등록일자 음성 및 텍스트 데이터 생성시스템 10-2690078 2024.07
- 상세주소
- 404호 디엠티랩스
- 설립일자
- 2018-02-20
- 실적(요약)
- 한국데이터산업진흥원(Kdata), 한국지능정보사회진흥원(NIA), 한국전자통신연구원(ETRI), 한국과학기술정보연구원(KISTI) 등 국내 공공기관으로부터 데이터 가공 및 언어 처리 관련 소프트웨어 개발 과제를 수행.또한 에버트란, 케이앤랩, 모닝테크놀로지, 아이비스 등 기업과 음성 언어 처리 분야에서 지속적인 협력을 이어오며,미국, 유럽, 중국 업체와의 음성 DB 구축 및 Adobe, Netflix의 자막 번역 사업으로 데이터 구축 및 가공 전문기업으로 성장.Kdata데이터바우처 공급기업(22년)NIA 인공지능 학습용 데이터 구축사업(20년~23년)AI바우처 지원사업 (AI반도체 분과) 공급기업 (23년, 결과평가 우수)산업맞춤형 혁신바우처 지원사업 공급기업 (23년, 우수 사례 선정)문화데이터 활용기업 사업화지원사업 (23년)예술-기술 매칭사업 (23년, 2건)NIA공공부문 이용SaaS개발·검증(교육SaaS트랙)과제 수행(24년~25년)TIPA창업성장기술개발사업(디딤돌)연구개발 과제 수행(24년~25년)AICA AI (시)제품·서비스 제작 지원사업(24년)ETRI 대화 및 번역 관련 연구 과제(18년~24년)KISTI 과학기술산업 혁신전약 분석 의사결정지원 시스템 개발(24년)KISTI 논문 추출 및 입력 시스템 개발(20년) 분야 사업명 사업기간 발주처 사업내용 음성데이터 안내용 로봇 원거리 다채널 대화체 음성 데이터 구축 및 가공 2019.02~03 모닝 테크놀로지 2인 자유 발화 350시간, 3인 자유 발화 50시간 원어민과 비원어민 간 한국어 음성 대화 DB 구축, 전사, 및 문장 단위 segment 2019.09~11 모닝 테크놀로지 외국인 한
- 유지보수(후속지원)전략(요약)
- 가. 서비스 제공 계획 및 목표1) 데이터 구축 및 가공 플랫폼과 검증 도구를 소개2) 객관적인 데이터 검증 및 데이터 정확성 보장 (국제공인 검증 평가 방법을 활용)3) 가공 데이터 활용 가이드라인 제공나. 유지보수 및 고객관리1) 유지보수: 사업 종료 후 1년 이내 하자 및 추가 요구 사항에 대해 무상 수정. 하자 보수 작업 계획적으로 진행.2) 추가 사항: 사업 완료 후 1년 이내 수요기업의 추가 요청에 대해 유상 또는 무상으로 진행 협조.3) 고객관리 및 고객 응대 계획: 사업 담당자가 수요기업과 소통, 내부 현황을 고려하여 일정 조율, 전담 PM 배정 후 연결, 작업 진행 상황 공유.4) 수요 증가에 따른 제공 방안: 필요 시 추가 인력(작업자/검수자/PM) 채용 및 내부 인력 업무 지원 가능.다. 협업체계를 위한 방안1) 효과적인 데이터 학습 모델 제안2) 데이터 활용 서비스 모델을 구상하여 협업 추진3) 추가 데이터 수집, 가공, 개발에 대한 수요 파악4) 추후 자사 서비스 이용 시 우대 혜택 제공
- 주요서비스 상세정보(요약)
- 1. 클라우드 기반 데이터 구축 및 가공 플랫폼 서비스 자사 개발 플랫폼으로, 전문 프리랜서가 교육과 테스트를 통해 데이터 구축에 참여 가능. 기업 및 개인이 데이터 구축 및 가공 의뢰 가능. 다국어 번역, 고문서 번역, 대화 데이터 구축 등 다양한 데이터 가공 지원. 고품질 데이터 구축을 위해 철저한 과정 준수. 데이터 외부 유출 방지를 위한 온라인 도구 사용. 2. 8개 국어 양방향 인공지능 자동번역 기술 솔루션 한국어 중심으로 8개 언어 간 양방향 자동번역 기술 보유. 다양한 도메인(뉴스, 여행, IT, 의료 등)에 특화된 번역 솔루션 제공. 3. RPC 기반 실시간 통번역 서비스 DILATO RealTrans™: 발화와 동시에 번역되는 실시간 통번역 서비스. 11개 이상 언어 지원, 빠른 반응속도와 정확한 통역 제공. 4. 다양한 분야 대화 데이터 구축 및 지식 가공 서비스 맛집, 숙박 관련 대화 데이터 구축 및 가공. 대화 상태 기반의 지식 가공 제공. 5. 문서 영역 인식 기반 메타데이터 추출 기술 PDF 문서에서 특정 메타데이터를 추출하는 기술. KISTI와 협력하여 93%의 정확도로 데이터 추출 실험. 6. 음성 전사 및 영상 자막 번역 및 생성 서비스 다양한 도구를 이용한 다국어 음성 데이터 구축 및 자막 번역 제공. 영상에서 음성을 추출하고 번역하여 자막 생성. 7. 영상 자막 번역 서비스 영상 파일 업로드 후 실시간 자막 번역 제공. 자막 편집 및 다운로드 기능 지원. 8. 번역전문 플랫폼 인공지능 통합 번역 플랫폼으로 MTPE 기능 제공. 사용자 맞춤형 번역 서비스 및 프로젝트 관리 기능 보유. 전문 및 비전문 분야의 번역 서비스 제공.
- 카테고리구분
- 전처리,품질,코딩,정보추출또는조합,태깅또는라벨링,분석,가명처리,AI Hub 학습용 데이터 재가공,생성·수집,자동화
- 품질확보전략(요약)
- 가. 품질 제고를 위한 조직 및 인력품질 전담조직: 각 가공 서비스별 검수팀 구성품질 전담인력: 검수 팀장 및 작업자로 구성, 피드백 제공 및 오류 검사 프로그램 활용나. 품질관리 프로세스1. 작업 프로세스: 수집 → 정제 → 가공 → 검수 → 수정 및 납품 → 유지 보수2. 품질 관리 프로세스:인공신경망 기계번역, 전문 번역가의 포스트 에디팅, 검수팀 검토, 최종 검증요구사항 파악 및 품질 관리 계획 수립검수팀 업무 분장 및 연락망 공유오류 분석 및 반복 오류 방지 교육저작권 침해 방지 및 손해배상 책임 명시1) 조직 구성 및 역할 분장내부 인력 및 외부 인력의 팀 구성-프로젝트 관리자: 계획 수립 및 관리-검수자: 지침 준비 및 검수-작업자: 정제 및 가공 작업-개발자: 도구 개발 및 환경 개선2) 교육 및 역량 강화사전 테스트 및 가이드라인 교육추가 지침 및 피드백 공유3) 수요기업과의 커뮤니케이션 및 작업 진행커뮤니케이션: 메신저, 메일, 통화로 진행 상황 공유사전 협의: 요청 사항 및 계획 협의작업 준비: 적합한 인력 배정 및 교육 실시데이터 상품화: 사용 방안 정리 및 최적화데이터 수집 및 가공: 효율적 방식 선택 및 작업 관리데이터 검수: 1차 및 2차 검수 진행산출물 제출: 관리팀이 자료 취합하여 제출보고서 제출: 각종 보고서는 관리팀이 취합하여 작성 및 제출
- 활용사례(요약)
- - 번역 말뭉치 데이터(1) 번역 말뭉치는 언어쌍별, 도메인별, 분야별 인공지능 번역 모델 생성, 모델 성능 향상에 활용할 수 있음.(2) 번역 응용뿐만 아니라 형태소분석과 같은 언어 분석 데이터로도 활용 가능(3) BERT, BART, GPT-2 또는 GPT-4와 같은 대형 인공지능 언어 이해 모델 학습에도 활용 가능 - 음성 데이터(1) 음성 말뭉치 데이터의 경우, 해당 언어 음성인식(Speech To Text) 모델 생성, 성능 향상에 활용할 수 있음.(2) 음성 데이터 역시, 전사된 텍스트는 위와 같이 다양하게 활용할 수 있고, 음성도 지역, 성별, 나이 등에 따라 다양하게 모델 학습 및 활용이 가능하다.- 대화 데이터(1) 대화 데이터의 경우, 목적 지향 대화 시스템의 대화 시스템 구축, 성능 향상에 활용할 수 있음(2) 대화 데이터는 원시 구축 대화 데이터, 맞춤법 검사와 대화 오류 검수를 거친 대화 데이터, 대화 지식 부착한 대화 등으로 가공한다. - 자막 데이터(1) 자막 데이터의 경우, 영상 원시어 자막, 타언어 자막 생성에 활용할 수 있음.(2) 자막 파일 역시 인공지능 기반 자막 번역 시스템 모델 생성 및 성능 향상에 활용될 수 있다.- 이미지 인식 데이터(1) 이미지 데이터의 경우, 이미지 중 텍스트 인식, 인식된 텍스트 번역을 통해 이미지 번역 인공지능 모델 생성에 활용할 수 있음
상세 시스템 데이터 보기
- 경도
- 126.97015152
- 번호
- 304
- 위도
- 37.53013354