1대1 문의하기
카카오톡 채팅하기
상단으로 이동
Big Data

데이터바우처
지원사업

헬스케어 데이터를 가장 잘 아는 기업,
닥터송과 협약하세요

데이터바우처 지원사업이란 데이터 활용을 통해 비즈니스 혁신 및
신규 제품·서비스 개발 등이 필요한 기업에 바우처 형식의
데이터 구매·가공서비스를 지원하는 사업을 말합니다.

자세히 알아보기
Mobile Phone
Laptop
01

데이터바우처
지원사업

01. 데이터바우처 지원 사업

데이터 기반 비즈니스 혁신 및 AI개발ㆍ도입 촉진을 위해
바우처 형식으로 데이터 구매‧가공서비스 지원

02. 지원대상

일반부문 : 초기 중견기업, 중소기업 소상공인, 예비창업자
※ 청년기업 포함

사회현안해결부문 : 중앙행정기관 및 지방자치단체, 공공 및 연구기관, 대학연구팀, 병원
※ 일반부문 지원대상 신청 불가

03. 지원내용

일반가공 : 기업 1건당 정부지원금 최대 3,200만원 지원
일반/사회현안 해결, 데이터가공(일반), 서비스개발, 고도화, 데이터분석 등 비즈니스 추진을 위해 필요한 데이터 가공서비스 비용 지원

AI 가공 : 기업 1건당 정부지원금 최대 5,400만원 지원
일반/사회현안 해결, 데이터가공(AI), 생성형AI, 인공지능 기술을 활용한 서비스·제품개발, 비즈니스 추진을 위해 필요한 데이터 가공서비스 비용 지원

04. 신청기간

일반 가공 : 2024년 4월 1일까지

AI 가공 : 2024년 4월 2일까지

05. 추진 절차 및 일정

공모접수(2-4월) ⭢ 선정평가(4-5월) ⭢ 협약(5월 말) ⭢ 사업수행 및 평가 등(6-12월)

02

데이터 가공
프로세스

데이터 가공 프로세스

01. 업무 협의 및 데이터 설계

- 수요기업의 가공 데이터 요구사항 정의 및 분석

- 필요한 데이터 종류 및 품질과 수집, 가공 방식 협의

- 데이터 가공정제 및 융합을 위한 용어, 형식, 유형 등 기준 확인

- 가이드라인의 모호성을 최소화하기 위해, 품질 기준을 합의하고 파일럿 프로젝트를 진행
- AI 학습용 데이터 설계과정은 ETL(Extraction – Tramsformation - Loading) 과정에 따름

02. 데이터 수집 Crawling

- 인공지능 학습을 위한 텍스트, 이미지, 영상 데이터 수집

- 정형 · 비정형 데이터 수집 : SNS 및 포털 사이트의 오픈 데이터, 정부 및 기관의 공공 데이터, 기업
내부의 비구조적 데이터 등등

- 원시데이터 선정 시 법적 문제 발생 여부 등을 파악하여 인공지능 학습용 데이터 구축에 활용할 수
있는 데이터 선정

03. 데이터 전처리 Preprocessing

- 데이터 종류 및 특성, 품질에 맞춰 공학적인 전처리 진행

- 데이터 정제 cleaning, 통합 integration, 축소 reduction, 변환 transformation 등

- 의미적 데이터 전처리는 도메인의 전문 지식이 요구되는 분야임, 당사 내부 구성원들은 의료기관
임상 경험과 IT 지식으로 헬스케어 데이터 가공·재구성 시 데이터의 유실을 줄이고 품질을 높임

04. 데이터 가공 Annotation

- Text Annotation : 자사 데이터 가공 솔루션 SDA를 활용하여 인공지능 학습데이터 구축

- Image Annotation : 자사 데이터 가공 솔루션 GDA를 활용하여 인공지능 학습데이터 구축

- 의료 및 헬스케어 데이터 가공은 개인정보법에 의거 의료기관의 의료데이터에 직접적인 접근이
불가능할 경우 IRB 승인 후 진행

05. 데이터 검수 및 검증

- 대시보드를 활용하여 실시간 데이터 검수 관리

- 데이터 가공 종류 및 방법에 따라 교차검수 또는 레이블링 검수를 실행

- 의료기관의 일부 데이터는 일반인 접근에 한계로 의사, 간호사, 의료기사 등의 전문 의료진이 판단
및 검수 절차를 진행하는 전문가 동료검토 professional peer review 실시

- 1cycle 검사는 데이터 8:2:2 를 나누어 훈련용 8, 테스트용 2, 검증 2로 나누어 검사

06. 데이터 분석 및 시각화

- 알고리즘과 수학적 처리를 통한 데이터 분석 NLP, ML, DL 시행

- R, SAS, SPSS 등을 통하여 데이터 가공하고 다양한 통계기법으로 분석

- 시각화 도구로 시계열 외 다양한 차트와 그리드 제공하여 인사이트를 도출할 수 있도록 제공

데이터바우처 공고 자세히 보기
03

데이터 수집 솔루션

MDA 모다

AI 데이터 가공 솔루션 ‘MDA 모다'

병렬 고속 스크래핑 엔진

타겟 자료 수집시 병렬로 이미지를 제거하고 고속 파서를 사용하여 빠르게 데이터를 수집합니다.

포털의 단순 뉴스, 웹페이지 외 다양한 채널 지원

블로그, 카페, 트위터, 페이스북 등 다양한 채널에 대한 스크래핑이 가능합니다.

다양한 형식 지원

txt, csv, html, json 등 다양한 형식의 출력을 지원합니다.

스크래핑 차단 방지기능

스크래핑 차단에 대응하기 위해 딜레이, IP 우회 등 방지기능을 갖추고 있습니다.

시각화 자료 제공

타겟 url 및 스크래핑 상황과 결과를 안내하는 시각화 자료를 제공합니다.

04

데이터 정제 및 분석 솔루션

닥터 NLP

데이터 정제 및 분석 솔루션 '닥터NLP'

자연어 데이터 분석을 위한 다양한 분석 기능

형태소 분류, 단어사전 구축 등

다양한 모델링 지원

토픽 모델링을 위한 LDA, BERT, LDA-BERT, TF-IDF 등 다양한 모델링 알고리즘 선택 기능

csv 파일 지원을 통한 편리한 분석

csv 파일 업로드를 지원함으로써 빠르고 편리한 분석이 가능

텍스트 전처리 기능

Normalization, stemming, stop words 설정 등 텍스트 전처리 기능

데이터 분석을 위한 시각화 기능

UMAP, wordcloud, graph 등 데이터 분석을 위한 다양한 시각화 툴 지원

05

텍스트 데이터 가공 솔루션

SDA 쓰다

“글이 필요한 곳에 우리가 있습니다, 쓰다"

편리한 문서 불러오기 기능

word, text 파일을 읽어 Input 데이터로 로드하여 사용할 수 있습니다.

문장 · 문단 자동 구분 기능 - 특허보유

로드한 문서의 문장과 문단을 자동으로 분류하여 구분 처리합니다.

문장 · 문단 이동 편집 기능

문장 · 문단의 이동과 삽입, 삭제 기능을 편리한 인터페이스로 제공합니다.

맞춤법, 띄어쓰기 체크 기능

원본 문서의 맞춤법과 띄어쓰기를 버튼 한번 클릭으로 자동 검사합니다.

작업자 검수 기능

텍스트 전처리 작업자와 작업시간을 추적하는 검수기능이 있어 관리가 용이합니다.

문장 · 문서 유사도 체크

sen2vec · doc2vec 기술로 문장과 문서의 유사도를 파악하여 중복된 데이터 수집을 방지합니다.

문장 요약 기능

문장을 자동으로 요약합니다.

문장 분절 기능 - 특허보유

긴 문장의 경우 구절별로 자동으로 분절하여 인공지능 인식율을 상승 시킵니다.

음성-텍스트 변환을 위한 STT-TTS 기능

음성 자료를 텍스트로 변환하는 STT 및 텍스트를 음성자료로 변환하는 TTS 기능

06

이미지 데이터 가공 솔루션

GDA 긋다

“한 줄 선긋기로 시작하여 우리만의 이미지를 탄생시키다! 긋다”

- 이미지 기반의 객체 감지를 위한 훈련용 데이터를 생성하기 위해 다양한 기능을 제공

- 이미지에 효율적으로 레이블을 지정하도록 설계된 웹 기반 이미지 주석 도구

- 다양한 Segmentation기술 지원 : 대표적으로 Image labelling, segmented image,
detection of instance segmentation, labelling unvisible object, Annotation 기능

- 이미지 전처리 가능하며 Boxing, Polyline, Polygon 형태의 어노테이션 생성, 수정, 삭제 가능

- Labeling 데이터 파일 경로 자동 변경, 파일명 자동 변경, COCO dataset 포멧 설정 등 가능

07

헬스케어 데이터를

가장 잘 아는 기업

기업소개 및 핵심역량

닥터송은 의료기관을 포함한 헬스케어 분야에 전략, 기획, 기술, 실행 등의 노하우를 보유하고, 국내 100여 곳 이상의 의료기관 및 헬스케어 기업 거래처를 보유한 15년 전통의 기업입니다.

헬스케어 인공지능 및 데이터 연구개발을 위해 기업부설연구소를 설립하고, 벤처기업 인증, 이노비즈 인증, 강소기업 선정 등을 통해 경영력과 기술력을 인정받았습니다.

자연어처리 및 인공지능 기반 저작 관련 해외 PCT 출원 1건, 국내 특허 4건 등록, 국내 특허 1건 출원, 국내외 논문 2건 발표하였습니다. 또한 키워드·문장·문단별 분류 및 분석 핵심 알고리즘 개발, 데이터 가공 및 분석 관련 SW 등 7건을 보유하고 인공지능 SW 개발 및 빅데이터 분석 알고리즘 연구하고 있습니다.

당사는 인공지능과 빅데이터 관련 핵심 알고리즘을 개발하기 위해 전문개발인력과 의학데이터를 가공 및 검수할 수 있는 보건의료인력, 데이터 분석을 위한 빅데이터전문가, 데이터 시각화를 위한 전문디자이너, 사업화 과정과 기획 및 홍보에 시너지를 낼 수 있는 헬스케어 전문 마케터들이 함께 합니다.