- 도로명 주소
- 서울 구로구 디지털로26길 123
- 우편번호
- 08390
- 영문주소
- 123 Digital-ro 26-gil, Guro-gu, Seoul
주식회사 윤즈정보개발의 전체 정보
- 기업개요 및 핵심역량(요약)
- 1. 기업 개요윤즈정보개발은 2009년 설립 이후 15년 이상 데이터 구축 및 가공 분야에서 전문성을 쌓아온 기업으로, 인공지능 학습용 데이터 및 디지털 아카이브를 구축하며 국내외 주요 기관과 성공적인 프로젝트를 수행해왔습니다. 한국학, 동양고전, 현대 문헌 등 다양한 분야의 데이터를 체계적으로 수집, 정제, 가공하며 최적화된 솔루션을 제공합니다.2. 핵심 역량가. 대규모 데이터 구축 능력고전 어휘 수집 및 속성 분류: 국내외 주요 한자 사전에서 2,090,000건의 어휘를 수집하고 20여 개의 속성으로 세분화하여 동양고전 번역 및 AI 분석에 활용.형태의미분석 말뭉치 구축:고전 문헌: 12,100,000 어절의 동양고전 및 조선왕조실록 데이터를 구축하여 국내 유일의 고전 문헌 분석 데이터 제공.현대 문헌: 72,500,000 어절의 현대 문헌 형태소 분석 데이터로, 신문기사 및 세종 원시 데이터를 기반으로 구축.漢韓 병렬 말뭉치: 조선왕조실록, 동양고전, 한국고문헌의 90,080,000 어절을 구축해 번역 시스템과 AI 학습에 기여. 나. AI 학습용 데이터 가공 전문성약 77개 매체에서 제공된 방대한 신문기사 데이터를 정제 및 라벨링하여 수요 맞춤형 데이터 제공.다양한 언어와 서체의 한자를 포함한 이미지 데이터를 OCR 모델로 처리하며, 정확도 95% 이상 달성.방송콘텐츠, 한국학 관련 콘텐츠 음성 전사 및 의미정확성, 형태의미분석 등 라벨링 데이터 생성. 다. 고품질 이미지 구축 능력장서각 기록유산 DB 구축 사업에서 왕실족보(선원속보) 53,990면의 원문 이미지를 디지털화하고, 최적화된 촬영 장비를 활용해 높은 품질의 이미지를 제공.
- 기업한글명
- 주식회사 윤즈정보개발
- 도로명주소
- 서울특별시 구로구 디지털로26길 123 (구로동,지플러스타워)
- 등록일
- 2025-02-14
- 링크(URL)
- https://kdata.or.kr/datavoucher/is/selectPortalFileDetail.do?rcpnYear=2025&brno=1288642831&sprnSctrCd=P01014002&prdcId=&sprnDsncCd=P11014001
- 보유솔루션(요약)
- ▷AI 기반 번역 지원 시스템▷AI 교열 시스템▷AI 기반 형태소 분석기, 개체명 인식, 의미역 분석기▷AI 기반 RAG 번역 시스템▷AI 기반 한문, 한글 OCR 시스템▷XML 기반 데이터 처리 시스템▷GPU RTX3080 서버
- 상세주소
- 지플러스타워 504호
- 설립일자
- 2009-10-07
- 실적(요약)
- 사 업 명사업기간계약금액발주처비 고2023년 신문 기사 원문 자료 수집 및 정제23.04~23.10343,000국립국어원주관사업자2023년 동양고전정보화사업23.05~23.11255,200전통문화연구회주관사업자인공지능 학습용 데이터 구축 사업(002)23.07~23.12875,000한국지능정보사회진흥원참여사업자인공지능 학습용 데이터 구축 사업(091)23.09~23.121,703,500한국지능정보사회진흥원주관사업자한국고전총간 영인 조판 및 원문 입력 사업23.02~23.08279,400한국고전번역원주관사업자산업맞춤형 혁신 바우처 지원 사업23.05~23.1264,211정보통신산업진흥원수요기업2022년 충청국학인물 관계망 DB구축 학술용역22.07~22.1270,000충청남도역사문화연구원주관사업자2022년 세종한글고전DB구축사업 22.07~22.1197,900세종대왕기념사업회주관사업자2022년 남산예술센터 전문데이터 품질보완 및 공공데이터 개방22.06~22.12200,575한국지능정보사회진흥원주관사업자2022년 동양고전정보화사업22.06~22.11266,760전통문화연구회주관사업자2022년 인공지능 학습용 데이터 구축 사업 1-922.05~22.113,759,841한국지능정보사회진흥원참여사업자2022년 인공지능 학습용 데이터 구축 사업 1-1022.05~22.113,769,107한국지능정보사회진흥원참여사업자2022년 신문 기사 원문 자료 수집 및 정제22.04~22.10323,750국립국어원주관사업자2022년도 한국고전총간 영인 조판 및 원문 입력사업22.01~22.08279,400한국고전번역원주관사업자2021년 신문 기사 원문 자료 수집 및 정제21.04~21.10318,500국립국어원주관사업자충청국학 디지털 아카이브 제작21.07~21.12125,000충청남도역사문화연구원주관사업자2021년 동양고전정보화사업21.05~21.11275,500전통문화연구회주관사업자2021년 고전번역서DB구축 21.06~21.12305,000한국고전번역원주관사업자2021년 세종
- 유지보수(후속지원)전략(요약)
- 1. 수요기업 대상 서비스 제공 계획 및 제공 목표제공 계획윤즈정보개발은 수요기업의 맞춤형 데이터 가공 및 관리 서비스를 제공할 계획입니다.데이터 가공 서비스: 정제된 신문기사 데이터, 형태소 분석 데이터, 그리고 AI 학습용 데이터 제공.데이터 품질 유지: 지속적인 데이터 모니터링 및 품질 검수를 통해 신뢰성 확보.맞춤형 제공: 수요기업 요구사항에 따라 데이터의 유형 및 형식을 맞춤화하여 제공.제공 목표수요기업의 AI 모델 성능 향상을 위한 고품질 데이터 제공.프로젝트 수행 기간 동안 100%의 데이터 정합성 확보.지속적인 유지보수를 통해 데이터 오류율을 1% 미만으로 관리. 2. 수요 증가에 따른 가공 서비스 제공 방안확장형 인프라 구축데이터 수요 증가에 대비하여 확장 가능한 클라우드 기반 인프라를 활용하여 처리 용량을 유연하게 조정.자동화 데이터 파이프라인 구축을 통해 대량의 데이터를 효율적으로 수집, 가공, 정제.전담 인력 운용수요기업 맞춤형 데이터 서비스를 제공하기 위해 전담 인력팀을 운영하여 신속한 대응 체계 마련.필요시 추가 인력 투입을 통해 수요 급증에 유연하게 대응.가공서비스 단계화데이터 수요를 단계별로 예측하여 우선순위를 설정하고 단계별로 서비스를 제공.긴급 수요 발생 시 신속 대응을 위한 단기 작업팀 가동. 3. 하자보수 처리 방안유형처리 방안기간일정한 패턴전체를 대상으로 해당 패턴을 검증하고 수정 및 반영지침의 변경에 따르는 반영무상 1년단발 오류해당 오류를 즉시 수정 및 반영무상 1년일관성 오류전체를 대상으로 해당 오류를 재검증하여 일관성 확보무상 1년기타사소한 오류는 의뢰 즉시 수정무상 1년 고객 관리 및 응대 계획전담 고객지원팀 운영: 수요기업의 문의 사항 및 요청에 대해 24시간 이내 응답.고객 피드백 채널 구축: 실시간 피드백 수집 및 분석을 통해 서비스 품질 개선.정기 미팅: 수요기업과의 주기적인 협의체 운영을 통해 문제 해결 및 협업 강화.
- 주요서비스 상세정보(요약)
- 1. 텍스트 콘텐츠 정제:신문 기사 데이터에서 발생하는 구조적, 형식적 문제를 해결하는 정제 기술을 보유.본문과 소제목 연결 오류 복구, 불필요한 개행 부호 및 HTML 태그 제거.캡션 정보 및 부적절한 부호(<>, 인용 부호 등)의 오처리를 정밀 복구.문장 부호 및 한자 호환 코드 문제로 인한 데이터 일관성 문제 해결.2. 저작권 관리:콘텐츠의 저작권 문제 소지가 있는 데이터를 사전에 선별 및 제거.윤즈정보개발과 협업중인 전문 법률 자문 법인(콘텐츠 전문)을 통한 저작권 해결 제시. 3. 구조화 및 라벨링 데이터모든 데이터는 AI 학습을 위해 구조화 및 라벨링 작업을 진행.문서의 주요 섹션, 문맥 정보, 키워드 등을 체계적으로 정리.고품질 라벨링을 통해 다양한 AI 학습 모델에서 활용 가능.형태소 및 의미 분석 데이터AI 모델의 자연어 이해를 향상시키기 위해 형태소 및 의미 분석 결과를 포함.문맥적 의미와 단어의 형태를 명확히 분석하여 텍스트 이해도를 극대화
- 카테고리구분
- 전처리,품질,정보추출또는조합,태깅또는라벨링,분석,AI Hub 학습용 데이터 재가공,큐레이션,설계,생성·수집,자동화
- 품질확보전략(요약)
- 1. 데이터 수집 단계신문 콘텐츠: 한국언론진흥재단의 공식 인증 유통 기관으로서, 뉴스 데이터와 같은 원천 자료에서 정확성과 신뢰성이 확보된 데이터를 선별.비정형 데이터(동영상, 이미지, 텍스트 등): 저작권을 보유한 개인 혹은 기관과 협의를 통하여 공신력 있는 데이터를 구매하여 전처리 과정을 통해 분석 가능하고 활용 가능한 형태로 변환함.2. 수집 데이터 검증수집한 데이터를 다단계 검수 프로세스를 통해 품질을 확인.데이터 오류, 중복, 불완전성 등을 자동 검출하는 알고리즘과 숙련된 전문 인력의 수작업 검수를 병행.3. 품질 유지 및 사후 지원납품 이후에도 데이터의 품질 유지와 지속적인 관리를 위해 다음과 같은 방안을 제공.4. 사후 품질 보증데이터 활용 과정에서 발견되는 오류나 문제점을 신속히 수정하고, 재가공하여 재납품.5. 하자 보수하자 보수는 수행사의 잘못으로 인해 발생한 하자를 보수하는 것을 말하며, 그 책임은 사업자에게 있음.
- 활용사례(요약)
- 1. 자동화된 데이터 정제 및 라벨링 서비스대규모 텍스트, 이미지, 음성 데이터를 정제 및 라벨링하여 AI 학습에 최적화된 데이터셋 생성.활용 예시:검색 엔진 기업: 사용자 검색 기록을 기반으로 의도 분류를 위한 텍스트 라벨링 데이터 구축.콘텐츠 플랫폼: 음성, 텍스트 데이터를 전처리하여 각 콘텐츠 활용 AI 학습 데이터 제공.자동 요약: 데이터 전처리 과정에서 문서 요약 기술을 활용하여 분석 가능한 정보를 간략화하고 전달.2. AI 기반 역사 문헌 분석 및 디지털 아카이빙역사 문헌 데이터의 OCR, 형태소 분석, 의미 분석 서비스를 제공하여 디지털화.활용 예시:박물관 및 연구기관: 한자 문헌 OCR 및 번역 데이터 구축으로 디지털 아카이브 제작.정부 기관: 고문서 데이터의 AI 분석을 통한 정책 연구 지원.RAG 시스템 지원: 디지털화된 데이터에 정보 검색 강화 기술을 적용하여 효율적인 데이터 탐색 및 활용 가능.3. 실시간 데이터 분석 및 인사이트 제공 서비스설명: 실시간으로 수집된 데이터를 분석 가능한 형태로 정제하고 고객 맞춤형 인사이트를 제공.활용 예시:금융 기업: 뉴스 기사 데이터를 분석하여 주식 시장 변동 예측에 활용.공공 기관: 소셜 미디어 데이터 분석을 통해 시민 의견 파악 및 정책 설계.키워드 검색 및 주제 분류: 다양한 데이터에서 핵심 키워드를 추출하고 주제를 분류하여 빠른 인사이트 제공.4. AI 모델 검증 및 최적화 서비스설명: 기업이 개발한 AI 모델의 성능을 검증하고 학습 데이터를 추가 제공하여 모델 최적화.활용 예시:번역 기업: 번역 모델의 성능 향상을 위한 고품질 병렬 코퍼스 제공.제조 기업: 품질 관리 AI 모델의 검증을 위해 이미지 데이터셋 제공.자동 요약: 모델 테스트 중 생성된 데이터 결과를 요약하여 분석 및 검토를 용이하게 함.5. 기업 특화 RAG(정보검색 강화) 솔루션설명: RAG 기술을 통해 기업 내부 데이터와 AI 모델을 결합하여 질의응답 서비스 구축.활용 예시:법률 기업: 판례 및 법률문서 기반의 빠른 질의응답
상세 시스템 데이터 보기
- 경도
- 126.89774457
- 번호
- 96
- 위도
- 37.48314306