본문 바로가기

분류 전체보기

(31)
[CB Filtering] 4. Profile Learner(1) 지금까지는 CB Filtering의 전체적인 개요, Content Analyzer를 공부했다. 지금부터는 Profile Learner에 대해 공부할 것이다. Profile Learner에는 다음과 같은 종류가 있으며, 이번 포스팅에서는 Least Square만 설명할 것이다. 1. Least Square 2. Naive Bayes 3. Rocchio's Algorithm 위 그림은 유저들이 영화에 대해 점수를 매긴 것이다.(점수 뿐만 아니라 유저가 자신의 선호를 나타낸 것이라면 아무거나 상관없다.) feature 1 feature 2 feature 3 Love at last 1 0.9 0 Romance forever 1 1.0 0.01 Cute puppies of love 1 0.99 0 Nonstop ..
4. 심파이(SymPy)로 공부하는 미적분 책에 있던 모든 내용을 다루지는 않는다. 어렵거나 부연 설명이 필요한 부분만 다룰 것이다. 1. 테일러 급수 2. Gradient Vector, Jacobian Matrix, Hessian Matrix 테일러 급수 테일러 급수(Taylor Series) 또는 테일러 전개(Taylor Expansion)은 어떤 함수 $f(x)$를 우리가 다루기 쉬운 다항함수 형태로 바꾸어 준다. $f(x)=p_{\infty}(x)$ $p_n(x)=f(a)+f'(a)(x-a)+{f''(a)\over 2!}(x-a)^2+...+{f^{(n)}(a)\over n!}(x-a)^n$ $\qquad\quad=\Sigma_{k=0}^{n}{f^{(k)}(a)\over k!}(x-a)^k$ 근사다항식의 차수가 높으면 높을수록 $p_n(..
KNN CF 구현 KNN을 2가지 방법으로 구현하겠다. 참고한 출처는 맨밑에 있다. 1. sklearn패키지 이용 2. 코드 구현 1. sklearn패키지 사용 Import & Data df는 rating, movie 데이터로 만든 데이터 프레임이다. rating을 하나도 못받은 영화의 경우, df_rating movie id가 존재하지 않기 때문에 df 데이터프레임을 만들었다. 1 2 3 4 5 6 7 8 9 10 import pandas as pd import numpy as np import glob import matplotlib.pyplot as plt from matplotlib.backends.backend_pdf import PdfPages import time df_ratings = pd.read_csv(..
공구유통사 크레텍의 데이터 기반 고객관리 산업공구 유통 선도업체인 크레텍은 경쟁사들의 다양한 가격전략으로 인하여 가격에 민감한 고객들의 이탈 등 치열한 경쟁에 직면해 있다. 고객관계관리 강화를 통하여 이런 상황을 타개하여야 하는 크레텍은 내부적으로 축적되어 있는 거래데이터 및 고객데이터를 활용 하여 고객 맞춤형 상품추천을 하고, 고객군 분석을 통해 이탈고객 관리 방안을 마련할 수 있었다. 산업공구 유통 시장에서 경쟁력 강화를 위한 고객관리 방안 산업공구 유통시장은 고객들이 제품 가격에 민감하여 거래처의 변동이 심한 편이다. 따라서 경쟁사에 비해 가격이 저렴할수록 유리하기 때문에, 유통사들 간에 가격을 공개하지 않는 편이다. 하지만 크레텍은 시장 표준가격을 제시하기 위해 국내에서 유통되는 대부분의 공구에 대한 자사 판매가격 정보를 CTX에 공개하..
3-4. 고급 선형대수: SVD(1) Quick Review (1) Diagonalization Eigenvectors가 역행렬이 존재할 때(=선형독립일 때) $A=V\Lambda V^{-1}$과 같이 분해할 수 있다. (2) 대칭행렬의 대각화 1. 실수 대칭행렬 A의 고유값은 실수다. 2. 고유값이 서로 다른 고유벡터는 직교한다.(항상 대각화 가능하다) 3. 대칭행렬 A가 양의 (준)정부호이면 고유값은 모두 양수이거나 0이다. (3) 분산행렬 임의의 실수행렬 $X$에 대해 $A=X^TX$ 혹은 $A=XX^T$를 만족하는 $A$를 분산행렬이라고 한다. 1. 대칭행렬이다. 2. 양의 준정부호이다. 3. $X$가 풀랭크이면, $A$의 역행렬이 존재한다. (4) $A=V\Lambda V^T$ $\begin{cases} v_i^Tv_j=0(i \n..
선형대수 선형대수 이상화 교수님 강의 정리 미지수의 수= 방정식의수: unique한 값 존재 미지수의 수>방정식의 수: 해가 무한함 미지수의 수
우도 추정 [https://ratsgo.github.io/statistics/2017/09/23/MLE/](https://ratsgo.github.io/statistics/2017/09/23/MLE/) [https://datascienceschool.net/view-notebook/dc6528fbf3ed4f9885e243198ef7694c/] 최대우도추정 최대우도추정(maximum likelihood estimation)이란 모수(parameter)가 미지의 θ인 확률분포에서 뽑은 표본(관측치) x들을 바탕으로 θ를 추정하는 기법입니다. 다시말해, 표본들을 보고 모수를 추정하는 것이다. 동전 던지기를 예를 들어보자. 동전 던지기는 이항분포를 따르며, 앞면이 나올 확률 p와 뒷면이 나올 확률 1-p로 이뤄진다. 이항..
[A/B Test] A/B테스트 개인화 이론 안녕하세요! 데이터 맛집 스터디 주제로 소개된 A/B 테스트로 하여금 사용자들에게 커스터마이즈드 된 웹 경험을 제공하고 비즈니스 성과에 대해 괄목할 만한 성과가 있었는지 파악하기 위한 테스트이자, 앞으로의 향보에 대한 마일드 스톤이 될 A/B테스트에 실 예를 통해 이해하도록 하겠습니다. 카탈로그 웹사이트 VS 경험 우선 웹사이트 기업의 웹사이트, 비즈니스적으로 목적을 가진 내용을 웹에 표현한다 한다면, 마치 카탈로그 책자를 보는 것처럼 방문자로 하여금, 우리가 가진 정보를 최대한 많이 보여주는 것에 초점을 맞추었다. (오프라인의 예시) 상대방의 경험을 자주 관리하려면 , 점원이 손님을 보고 인상 행동 동선을 파악해서, 저 사람이 도움이 필요한가를 말하고, 지난번 산 물건을 기반으로 다른 상품을 추천해본다..