AI의 기초
최신 AI는 데이터 과학과 기계 학습을 기반으로 합니다. AI의 주요 목표는 일반적으로 사람과 관련된 기능을 컴퓨터에 활용하는 것입니다. 데이터 과학 개념이 AI의 기반을 뒷받침하는 이유를 살펴보겠습니다.
데이터 과학이란 무엇인가요?
데이터 과학은 AI를 달성하는 것을 목표로 하는 학제 간 분야 입니다. 주로 기계 학습과 통계 기술을 사용합니다. 대부분의 경우 데이터 과학자는 AI 문제 해결을 담당하는 전문가입니다.
기계 학습이란 무엇인가요?
기계 학습은 머신이 다양한 데이터 양을 자세히 검토하여 패턴을 찾아내는 기술입니다. 이 기술은 AI 용도로 자주 사용됩니다. 기계 학습은 데이터에 대한 차별화 기능을 기반으로 패턴을 익히는 머신에 학습시키는 알고리즘을 사용합니다. 학습 데이터가 많을수록 예측은 더 정확해집니다.
몇 가지 예제는 다음과 같습니다.
- Email 스팸 검색 - 기계 학습은 전자 메일에 "free" 또는 "guarantee"와 같은 단어가 있거나, 이메일 주소 도메인이 차단된 목록에 있거나, 텍스트에 표시된 링크가 그 뒤에 있는 URL과 일치하지 않는 패턴을 찾을 수 있습니다.
- 신용 카드 사기 탐지 - 기계 학습은 값비싼 품목 구매, 갑작스러운 마구잡이 쇼핑 등 소유자가 일반적으로 방문하지 않는 주소에서의 소비 패턴을 확인할 수 있습니다.
딥 러닝이란?
딥 러닝은 기계 학습의 하위 집합입니다. 딥 러닝은 연결된 인공 신경망으로서 인간의 두뇌가 정보를 처리하는 방식을 모방하는 것입니다. 기계 학습과 달리 딥 러닝은 데이터에 대한 복잡한 패턴 및 차별화 기능을 스스로 찾을 수 있습니다. 일반적으로 이미지, 텍스트, 오디오와 같은 비정형 데이터에서 작동합니다. 더 나은 분석을 위해 엄청난 양의 데이터가 필요하고 속도 향상을 위해 대규모 컴퓨팅 성능이 필요합니다.
예를 들어 딥 러닝을 사용하여 의료 이미지에서 암세포를 감지할 수 있습니다. 딥 러닝은 이미지의 모든 픽셀을 신경망 노드에 대한 입력으로 검색합니다. 노드는 각 픽셀을 분석하여 암처럼 보이는 기능을 필터링합니다. 노드의 각 계층은 잠재적인 암세포 검색 결과를 노드의 다음 계층으로 푸시하여 프로세스를 반복하고 결국 모든 결과를 집계하여 이미지가 무엇인지를 분류합니다. 예를 들어 이미지는 정상 이미지 또는 암 기능이 있는 이미지로 분류될 수 있습니다.
다음으로, 비즈니스에 AI를 추가하는 데 사용할 수 있는 Microsoft 도구의 네 가지 범주를 살펴보겠습니다.