인공지능의 상위 10가지 알고리즘
인공지능 알고리즘 상위 10개는 다음과 같습니다.
선형회귀는 아마도 가장 인기 있는 기계학습 알고리즘일 것입니다. 선형 회귀는 직선을 찾고 이 직선을 산점도의 데이터 점에 최대한 가깝게 맞추는 것입니다. 이 데이터에 직선 방정식을 맞춰서 독립 변수(x? 값)와 수치 결과(y? 값)를 나타내려고 합니다. 그러면 이 선을 사용하여 미래 가치를 예측할 수 있습니다!
로지스틱 회귀는 선형 회귀와 유사하지만 출력이 이진일 때(즉, 결과에 가능한 값이 두 개만 있을 수 있는 경우) 사용됩니다. 최종 출력의 예측은 로지스틱 함수 g()라고 하는 비선형 S자형 함수입니다.
의사결정 트리는 회귀 및 분류 작업에 사용할 수 있습니다.
나이브 베이즈는 베이즈 정리를 기반으로 합니다. 이는 각 클래스의 확률을 측정하고 각 클래스의 조건부 확률은 ?x? 값을 제공합니다. 이 알고리즘은 분류 문제에 사용되며 이진 "예?/?아니요" 결과를 생성합니다. 아래 방정식을 살펴보십시오.
SVM(Support Vector Machine)은 분류 문제에 사용되는 지도 알고리즘입니다. 서포트 벡터 머신은 데이터 포인트 사이에 가장 큰 여백을 두고 두 개의 선을 그리려고 시도합니다. 이를 위해 데이터 항목을 n차원 공간의 점으로 표시합니다. 여기서 n은 입력 특성의 수입니다. 이를 기반으로 서포트 벡터 머신은 클래스 레이블별로 가능한 출력을 가장 잘 분리하는 초평면(hyperplane)이라는 최적의 경계를 찾습니다.
K-Nearest Neighbors 알고리즘(K-Nearest Neighbors, KNN)은 매우 간단합니다. KNN은 전체 훈련 세트에서 K개의 가장 유사한 인스턴스(예: K개의 이웃)를 검색하고 이러한 모든 K개의 인스턴스에 공통 출력 변수를 할당하여 객체를 분류합니다.
K-평균(K-means)은 데이터 세트를 분류하여 클러스터링합니다. 예를 들어 이 알고리즘을 사용하여 구매 내역을 기반으로 사용자를 그룹화할 수 있습니다. 데이터 세트에서 ?K? 클러스터를 찾습니다. K-평균은 비지도 학습에 사용되므로 훈련 데이터 ?X와 식별하려는 클러스터 수 ?K만 필요합니다.
랜덤 포레스트(Random Forest)는 매우 인기 있는 앙상블 머신러닝 알고리즘입니다. 이 알고리즘의 기본 아이디어는 한 개인의 의견보다 많은 사람들의 의견이 더 정확하다는 것입니다. 랜덤 포레스트에서는 의사결정 트리의 앙상블을 사용합니다(의사결정 트리 참조).
현재 우리가 수집할 수 있는 데이터의 양이 엄청나게 많기 때문에 기계 학습 문제는 더욱 복잡해졌습니다. 이는 훈련이 매우 느리고 좋은 솔루션을 찾는 것이 어렵다는 것을 의미합니다. 이 문제는 종종 "차원성의 저주"라고 불립니다.
ANN(인공 신경망)은 크고 복잡한 기계 학습 작업을 처리할 수 있습니다. 신경망은 본질적으로 뉴런이라고 불리는 가중치가 부여된 가장자리와 노드로 구성된 상호 연결된 레이어 세트입니다. 입력 레이어와 출력 레이어 사이에 여러 개의 숨겨진 레이어를 삽입할 수 있습니다. 인공 신경망은 두 개의 숨겨진 레이어를 사용합니다. 그 외에도 딥러닝을 다루어야 합니다.