天天最資訊丨幫師妹開發(fā)一個系統(tǒng)過濾小程序
項目介紹
本期介紹一個基于協(xié)同過濾算法的商品推薦系統(tǒng),主要包括以下功能
(資料圖片僅供參考)
后臺管理系統(tǒng)功能:
后臺登錄
獲取微信小程序登錄的用戶信息
配置上架商品的屬性,分類,價格
獲取用戶在小程序端下的訂單列表
個人用戶配置,賬號修改;
微信小程序功能:
用戶授權(quán)實現(xiàn)微信登陸
首頁展示商品輪播圖+商品列表
商品詳情頁,獲取商品詳細sku
一鍵加入購物車,直接購買
維護用戶的收獲地址
訂單列表;
全部訂單,待收貨,確認收貨,退貨
用戶微信授權(quán)登錄后,根據(jù)每個用戶收藏的商品數(shù)據(jù),根據(jù)算法,找到有相似收藏愛好的用戶,已推薦相應(yīng)額商品。為了更方便大家的理解,如下圖:
該系統(tǒng)為每一個用戶都分配了一個用戶賬號,用戶通過賬號的登錄可以在系統(tǒng)中查看商品推薦信息及對個人信息進行修改等功能。
系統(tǒng)截圖
不止這些,基于協(xié)同過濾開發(fā)了很多的系統(tǒng):
現(xiàn)在對著算法的開發(fā)的思路還是比較成熟的,更多系統(tǒng)基于推薦算法功能的更新需求,或者系統(tǒng)開發(fā),可以私信評論區(qū)留言哦
協(xié)同過濾算法簡介
協(xié)同過濾算法是一種基于用戶行為數(shù)據(jù)的推薦算法,其基本思想是通過分析用戶行為數(shù)據(jù),找到不同用戶之間的相似性,從而預(yù)測用戶對未知物品的評分或偏好,從而給用戶提供個性化推薦。
協(xié)同過濾算法分為兩種:基于用戶的協(xié)同過濾和基于物品的協(xié)同過濾。
基于用戶的協(xié)同過濾基于用戶的協(xié)同過濾算法是通過分析用戶的歷史行為數(shù)據(jù),找到與目標用戶行為相似的其他用戶,從而推薦目標用戶可能感興趣的物品。
具體步驟如下:
計算用戶之間的相似度,如皮爾遜相關(guān)系數(shù)、余弦相似度等。找到與目標用戶相似度最高的K個用戶。綜合K個用戶對某個物品的評分,預(yù)測目標用戶對該物品的評分或偏好。推薦目標用戶評分最高的N個物品。協(xié)同過濾算法的優(yōu)點是可以處理任何類型的物品和用戶行為,同時還可以提供高度個性化的推薦。但是,它也存在一些問題,如數(shù)據(jù)稀疏性、冷啟動問題、可擴展性等。因此,在實際應(yīng)用中需要根據(jù)具體情況進行優(yōu)化和改進。
皮爾森(pearson)相關(guān)系數(shù)公式
皮爾森相關(guān)系數(shù)是用來衡量變量之間的線性相關(guān)性。但是有一個明顯的缺陷就是,它只對線性關(guān)系敏感。如果關(guān)系是非線性的,哪怕兩個變量之間是一一對應(yīng)的關(guān)系,皮爾森相關(guān)系數(shù)也可能接近0.
如果有兩個變量:X、Y,最終計算出的相關(guān)系數(shù)的含義可以有如下理解:
(1)、當(dāng)相關(guān)系數(shù)為0時,X和Y兩變量無關(guān)系。
(2)、當(dāng)X的值增大(減小),Y值增大(減小),兩個變量為正相關(guān),相關(guān)系數(shù)在0.00與1.00之間。
(3)、當(dāng)X的值增大(減小),Y值減小(增大),兩個變量為負相關(guān),相關(guān)系數(shù)在-1.00與0.00之間。
通常情況下通過以下取值范圍判斷變量的相關(guān)強度:
相關(guān)系數(shù) 0.8-1.0 極強相關(guān)
0.6-0.8 強相關(guān)
0.4-0.6 中等程度相關(guān)
0.2-0.4 弱相關(guān)
0.0-0.2 極弱相關(guān)或無相關(guān)
公式一:
公式二:
公式三:
公式四:
Java代碼實現(xiàn)
package com.jun.entity;
/**
* @author 不會寫文檔的程序員
*/
public class Movie implements Comparable<Movie> {
public String movieName;
public int score;
public Movie(String movieName, int score) {
this.movieName = movieName;
this.score = score;
}
@Override
public String toString() {
return "Movie{" +
"movieName="" + movieName + "\"" +
", score=" + score +
"}";
}
@Override
public int compareTo(Movie o) {
return score > o.score ? -1 : 1;
}
}
package com.jun.entity;
import java.util.ArrayList;
import java.util.List;
/**
* @author 不會寫文檔的程序員
*/
public class User {
public String username;
public List<Movie> movieList = new ArrayList<>();
public User() {}
public User(String username) {
this.username = username;
}
public User set(String movieName, int score) {
this.movieList.add(new Movie(movieName, score));
return this;
}
public Movie find(String movieName) {
for (Movie movie : movieList) {
if (movie.movieName.equals(username)) {
return movie;
}
}
return null;
}
@Override
public String toString() {
return "User{" +
"username="" + username + "\"" +
"}";
}
}
Recommend邏輯計算類:
/**
* 計算2個打分序列間的pearson距離
* 選擇公式四進行計算
* @param rating1
* @param rating2
* @return
*/
private double pearson_dis(List<Movie> rating1, List<Movie> rating2) {
int n=rating1.size();
List<Integer> rating1ScoreCollect = rating1.stream().map(A -> A.score).collect(Collectors.toList());
List<Integer> rating2ScoreCollect = rating2.stream().map(A -> A.score).collect(Collectors.toList());
double Ex= rating1ScoreCollect.stream().mapToDouble(x->x).sum();
double Ey= rating2ScoreCollect.stream().mapToDouble(y->y).sum();
double Ex2=rating1ScoreCollect.stream().mapToDouble(x->Math.pow(x,2)).sum();
double Ey2=rating2ScoreCollect.stream().mapToDouble(y->Math.pow(y,2)).sum();
double Exy= IntStream.range(0,n).mapToDouble(i->rating1ScoreCollect.get(i)*rating2ScoreCollect.get(i)).sum();
double numerator=Exy-Ex*Ey/n;
double denominator=Math.sqrt((Ex2-Math.pow(Ex,2)/n)*(Ey2-Math.pow(Ey,2)/n));
if (denominator==0) return 0.0;
return numerator/denominator;
}
public List<Movie> recommend(String username, List<User> users) {
//找到最近鄰
Map<Double, String> distances = computeNearestNeighbor(username, users);
String nearest = distances.values().iterator().next();
System.out.println("最近鄰 -> " + nearest);
//找到最近鄰看過,但是我們沒看過的電影,計算推薦
User neighborRatings = new User();
for (User user:users) {
if (nearest.equals(user.username)) {
neighborRatings = user;
}
}
System.out.println("最近鄰看過的電影 -> " + neighborRatings.movieList);
User userRatings = new User();
for (User user:users) {
if (username.equals(user.username)) {
userRatings = user;
}
}
System.out.println("用戶看過的電影 -> " + userRatings.movieList);
//根據(jù)自己和鄰居的電影計算推薦的電影
List<Movie> recommendationMovies = new ArrayList<>();
for (Movie movie : neighborRatings.movieList) {
if (userRatings.find(movie.movieName) == null) {
recommendationMovies.add(movie);
}
}
Collections.sort(recommendationMovies);
return recommendationMovies;
}
}
運行結(jié)果:
協(xié)同過濾算法的問題分析
目前,協(xié)同過濾技術(shù)得到了廣泛應(yīng)用。但是隨著網(wǎng)站商品信息量和用戶人數(shù)的不斷攀升,網(wǎng)站的結(jié)構(gòu)也越來越復(fù)雜,如果你有需要基于協(xié)同算法開發(fā)的需求,評論區(qū)留言呦,我們一起討論。通過對協(xié)同過濾技術(shù)以及推薦系統(tǒng)的研究,我們發(fā)現(xiàn)協(xié)同過濾技術(shù)的實現(xiàn)中存在的問題主要有以下幾點。
5.1 稀疏性問題
稀疏性問題是推薦系統(tǒng)面臨的主要問題。比如在一些大型電子商務(wù)購買系統(tǒng),用戶購買過的數(shù)量相對網(wǎng)站中商品數(shù)量可謂是冰山一角,這就導(dǎo)致了用戶評分矩陣的數(shù)據(jù)非常稀疏,進行相似性計算耗費會很大,也難以找到相鄰用戶數(shù)據(jù)集,從而使得推薦系統(tǒng)的推薦質(zhì)量急劇下降。
5.2 冷啟動問題
因為傳統(tǒng)的協(xié)同過濾推薦是基于用戶/物品的相似性計算來得到目標用戶的推薦,在一個新的項目首次出現(xiàn)的時候,因為沒有用戶對它作過評價,因此單純的協(xié)同過濾無法對其進行預(yù)測評分和推薦。而且,由于新項目出現(xiàn)早期,用戶評價較少,推薦的準確性也比較差。
5.3 可擴展性問題
面對日益增多的數(shù)據(jù)量,算法的擴展性問題成為制約推薦系統(tǒng)實施的重要因素。識別“最近鄰居”算法的計算量隨著用戶和項的增加而大大增加,對于上百萬的數(shù)目,通常的算法會遇到嚴重的擴展性瓶頸問題。
總結(jié)
協(xié)同過濾作為一種經(jīng)典的推薦算法種類,在工業(yè)界應(yīng)用廣泛,它的優(yōu)點很多,模型通用性強,不需要太多對應(yīng)數(shù)據(jù)領(lǐng)域的專業(yè)知識,工程實現(xiàn)簡單,效果也不錯。這些都是它流行的原因。
當(dāng)然,協(xié)同過濾也有些難以避免的難題,比如令人頭疼的“冷啟動”問題,我們沒有新用戶任何數(shù)據(jù)的時候,無法較好的為新用戶推薦物品。同時也沒有考慮情景的差異,比如根據(jù)用戶所在的場景和用戶當(dāng)前的情緒。當(dāng)然,也無法得到一些小眾的獨特喜好,這塊是基于內(nèi)容的推薦比較擅長的,小伙伴們歡迎一起學(xué)習(xí)研究探討。
標簽:
- 01 環(huán)球快訊:《怪物獵人崛起》曙光怪異煉金怎么解鎖? 怪異煉金解鎖方法
- 02 【世界新視野】全球最大塔式起重機正式下線
- 03 環(huán)球頭條:【國際漫評】危險的門鈴
- 04 今日看點:小米入股4D成像雷達公司賽恩領(lǐng)動 小米入股賽恩領(lǐng)動
- 05 實時焦點:美媒:數(shù)百萬美國人開支面臨壓力 不平等恐成美經(jīng)濟“定時炸彈”
- 06 前沿?zé)狳c:上坤地產(chǎn)今日復(fù)牌 午盤收漲超5%
- 07 全球熱消息:梨花時節(jié)思美人,“梨渦”有什么錯?
- 08 焦點快看:將在4月24日開啟預(yù)訂 新款吉利ICON主角官圖發(fā)布
- 09 預(yù)售價為10.9萬起 博越COOL將在4月26日上市
- 010 今日熱議:【國際漫評】擁槍教育從娃娃抓起?