영화 추천 시스템에는 어떤 기능이 포함되어 있습니까?
프로젝트 프로세스: 먼저 사용자 id 를 가져오고, 사용자가 이미 가지고 있는 권장 결과를 삭제하고, 샘플 점수 데이터 (사용자 ID, movieid, 점수, 타임스탬프 등 여러 사용자가 다른 영화에 대한 점수 데이터) 를 로드합니다. 그런 다음 영화 정보 데이터를 로드합니다 (movieinfo 테이블에서 movieid, moviename 및 typelist 제거).
참고: 샘플 점수 데이터 및 영화 정보 데이터. Dat 파일.
샘플 점수 데이터를 세 부분으로 나눕니다. 60% 는 교육 (교육 세트), 20% 는 검증 (검증 세트), 20% 는 테스트 (테스트 세트) 입니다.
서로 다른 매개변수로 모델을 교육하고 검사 세트에서 검사하여 최적의 모델을 찾습니다.
매개 변수 설정 (의미 요소 수 숨기기, ALS 정규화 매개 변수, 반복), 설정 매개 변수 및 교육 세트를 SPARKMLLLIB 라이브러리에 매개 변수로 전달하는 ALS () 함수를 권장 모델로 사용하여 여러 가지 다른 모델을 얻기 위해 매개 변수를 조정합니다.
인증 방법:
검사 세트를 모델에 배치하여 사용자가 영화에 대한 예측 점수를 받고, 예측 점수와 실제 점수의 제곱근 오류를 계산하고, 여러 모델에서 평방근 오차가 가장 적은 모델을 최적의 모델로 찾습니다.
최적 모델을 사용하여 테스트 세트의 점수를 예측하고 예측 점수와 실제 점수 사이의 rms 오류를 계산하여 최적 모델을 개선합니다.
최적의 모델을 사용하여 영화 정보 데이터 세트의 모든 영화에 대한 사용자 등급을 예측하고 순위가 가장 높은 상위 10 개 영화를 선택합니다. 권장 결과를 데이터베이스의 권장 결과 테이블에 저장합니다.
---------
저작권 고지 사항: 이 문서는 CSDN 블로거 "Senei" 원본 문장, CC 4.0 BY-SA 저작권 계약을 따릅니다. 전재 원출처 링크와 본 성명을 동봉해 주십시오.
원문 링크: /QQ _ 444592 19/ 문장/상세/118416465/