首頁> 快訊 > > 正文

            天天最資訊丨幫師妹開發(fā)一個系統(tǒng)過濾小程序

            2023-04-21 01:43:36來源:平靜的時光
            博主簡介:在計算機領(lǐng)域混戰(zhàn)了5年的java開發(fā)工程師,正在向全棧奮斗的路上。目前在學(xué)習(xí)和分享:Java,springboot,spring,vue,系統(tǒng)開發(fā),服務(wù)器運維(可做畢業(yè)設(shè)計)等相關(guān)知識。博主主頁: 不會寫文檔的程序員近期目標:寫好專欄的每一篇文章

            項目介紹

            本期介紹一個基于協(xié)同過濾算法的商品推薦系統(tǒng),主要包括以下功能


            (資料圖片僅供參考)

            后臺管理系統(tǒng)功能:
            后臺登錄
            獲取微信小程序登錄的用戶信息
            配置上架商品的屬性,分類,價格
            獲取用戶在小程序端下的訂單列表
            個人用戶配置,賬號修改;
            微信小程序功能:
            用戶授權(quán)實現(xiàn)微信登陸
            首頁展示商品輪播圖+商品列表
            商品詳情頁,獲取商品詳細sku
            一鍵加入購物車,直接購買
            維護用戶的收獲地址
            訂單列表;
            全部訂單,待收貨,確認收貨,退貨

            用戶微信授權(quán)登錄后,根據(jù)每個用戶收藏的商品數(shù)據(jù),根據(jù)算法,找到有相似收藏愛好的用戶,已推薦相應(yīng)額商品。為了更方便大家的理解,如下圖:

            該系統(tǒng)為每一個用戶都分配了一個用戶賬號,用戶通過賬號的登錄可以在系統(tǒng)中查看商品推薦信息及對個人信息進行修改等功能。

            系統(tǒng)截圖

            不止這些,基于協(xié)同過濾開發(fā)了很多的系統(tǒng)

            現(xiàn)在對著算法的開發(fā)的思路還是比較成熟的,更多系統(tǒng)基于推薦算法功能的更新需求,或者系統(tǒng)開發(fā),可以私信評論區(qū)留言哦

            協(xié)同過濾算法簡介

            協(xié)同過濾算法是一種基于用戶行為數(shù)據(jù)的推薦算法,其基本思想是通過分析用戶行為數(shù)據(jù),找到不同用戶之間的相似性,從而預(yù)測用戶對未知物品的評分或偏好,從而給用戶提供個性化推薦。

            協(xié)同過濾算法分為兩種:基于用戶的協(xié)同過濾和基于物品的協(xié)同過濾。

            基于用戶的協(xié)同過濾

            基于用戶的協(xié)同過濾算法是通過分析用戶的歷史行為數(shù)據(jù),找到與目標用戶行為相似的其他用戶,從而推薦目標用戶可能感興趣的物品。

            具體步驟如下:

            計算用戶之間的相似度,如皮爾遜相關(guān)系數(shù)、余弦相似度等。找到與目標用戶相似度最高的K個用戶。綜合K個用戶對某個物品的評分,預(yù)測目標用戶對該物品的評分或偏好。推薦目標用戶評分最高的N個物品。

            協(xié)同過濾算法的優(yōu)點是可以處理任何類型的物品和用戶行為,同時還可以提供高度個性化的推薦。但是,它也存在一些問題,如數(shù)據(jù)稀疏性、冷啟動問題、可擴展性等。因此,在實際應(yīng)用中需要根據(jù)具體情況進行優(yōu)化和改進。

            皮爾森(pearson)相關(guān)系數(shù)公式

            皮爾森相關(guān)系數(shù)是用來衡量變量之間的線性相關(guān)性。但是有一個明顯的缺陷就是,它只對線性關(guān)系敏感。如果關(guān)系是非線性的,哪怕兩個變量之間是一一對應(yīng)的關(guān)系,皮爾森相關(guān)系數(shù)也可能接近0.

            如果有兩個變量:X、Y,最終計算出的相關(guān)系數(shù)的含義可以有如下理解:

            (1)、當(dāng)相關(guān)系數(shù)為0時,X和Y兩變量無關(guān)系。

            (2)、當(dāng)X的值增大(減小),Y值增大(減小),兩個變量為正相關(guān),相關(guān)系數(shù)在0.00與1.00之間。

            (3)、當(dāng)X的值增大(減小),Y值減小(增大),兩個變量為負相關(guān),相關(guān)系數(shù)在-1.00與0.00之間。

            通常情況下通過以下取值范圍判斷變量的相關(guān)強度:
            相關(guān)系數(shù) 0.8-1.0 極強相關(guān)
            0.6-0.8 強相關(guān)
            0.4-0.6 中等程度相關(guān)
            0.2-0.4 弱相關(guān)
            0.0-0.2 極弱相關(guān)或無相關(guān)

            公式一:

            公式二:

            公式三:

            公式四:

            Java代碼實現(xiàn)


            package com.jun.entity;
            /**
            * @author 不會寫文檔的程序員
            */
            public class Movie implements Comparable<Movie> {
            public String movieName;
            public int score;
            public Movie(String movieName, int score) {
            this.movieName = movieName;
            this.score = score;
            }
            @Override
            public String toString() {
            return "Movie{" +
            "movieName="" + movieName + "\"" +
            ", score=" + score +
            "}";
            }
            @Override
            public int compareTo(Movie o) {
            return score > o.score ? -1 : 1;
            }
            }


            package com.jun.entity;
            import java.util.ArrayList;
            import java.util.List;
            /**
            * @author 不會寫文檔的程序員
            */
            public class User {
            public String username;
            public List<Movie> movieList = new ArrayList<>();
            public User() {}
            public User(String username) {
            this.username = username;
            }
            public User set(String movieName, int score) {
            this.movieList.add(new Movie(movieName, score));
            return this;
            }
            public Movie find(String movieName) {
            for (Movie movie : movieList) {
            if (movie.movieName.equals(username)) {
            return movie;
            }
            }
            return null;
            }
            @Override
            public String toString() {
            return "User{" +
            "username="" + username + "\"" +
            "}";
            }
            }

            Recommend邏輯計算類:

            /**
            * 計算2個打分序列間的pearson距離
            * 選擇公式四進行計算
            * @param rating1
            * @param rating2
            * @return
            */
            private double pearson_dis(List<Movie> rating1, List<Movie> rating2) {
            int n=rating1.size();
            List<Integer> rating1ScoreCollect = rating1.stream().map(A -> A.score).collect(Collectors.toList());
            List<Integer> rating2ScoreCollect = rating2.stream().map(A -> A.score).collect(Collectors.toList());
            double Ex= rating1ScoreCollect.stream().mapToDouble(x->x).sum();
            double Ey= rating2ScoreCollect.stream().mapToDouble(y->y).sum();
            double Ex2=rating1ScoreCollect.stream().mapToDouble(x->Math.pow(x,2)).sum();
            double Ey2=rating2ScoreCollect.stream().mapToDouble(y->Math.pow(y,2)).sum();
            double Exy= IntStream.range(0,n).mapToDouble(i->rating1ScoreCollect.get(i)*rating2ScoreCollect.get(i)).sum();
            double numerator=Exy-Ex*Ey/n;
            double denominator=Math.sqrt((Ex2-Math.pow(Ex,2)/n)*(Ey2-Math.pow(Ey,2)/n));
            if (denominator==0) return 0.0;
            return numerator/denominator;
            }

            public List<Movie> recommend(String username, List<User> users) {
            //找到最近鄰
            Map<Double, String> distances = computeNearestNeighbor(username, users);
            String nearest = distances.values().iterator().next();
            System.out.println("最近鄰 -> " + nearest);
            //找到最近鄰看過,但是我們沒看過的電影,計算推薦
            User neighborRatings = new User();
            for (User user:users) {
            if (nearest.equals(user.username)) {
            neighborRatings = user;
            }
            }
            System.out.println("最近鄰看過的電影 -> " + neighborRatings.movieList);
            User userRatings = new User();
            for (User user:users) {
            if (username.equals(user.username)) {
            userRatings = user;
            }
            }
            System.out.println("用戶看過的電影 -> " + userRatings.movieList);
            //根據(jù)自己和鄰居的電影計算推薦的電影
            List<Movie> recommendationMovies = new ArrayList<>();
            for (Movie movie : neighborRatings.movieList) {
            if (userRatings.find(movie.movieName) == null) {
            recommendationMovies.add(movie);
            }
            }
            Collections.sort(recommendationMovies);
            return recommendationMovies;
            }
            }

            運行結(jié)果:

            協(xié)同過濾算法的問題分析

            目前,協(xié)同過濾技術(shù)得到了廣泛應(yīng)用。但是隨著網(wǎng)站商品信息量和用戶人數(shù)的不斷攀升,網(wǎng)站的結(jié)構(gòu)也越來越復(fù)雜,如果你有需要基于協(xié)同算法開發(fā)的需求,評論區(qū)留言呦,我們一起討論。通過對協(xié)同過濾技術(shù)以及推薦系統(tǒng)的研究,我們發(fā)現(xiàn)協(xié)同過濾技術(shù)的實現(xiàn)中存在的問題主要有以下幾點。

            5.1 稀疏性問題
            稀疏性問題是推薦系統(tǒng)面臨的主要問題。比如在一些大型電子商務(wù)購買系統(tǒng),用戶購買過的數(shù)量相對網(wǎng)站中商品數(shù)量可謂是冰山一角,這就導(dǎo)致了用戶評分矩陣的數(shù)據(jù)非常稀疏,進行相似性計算耗費會很大,也難以找到相鄰用戶數(shù)據(jù)集,從而使得推薦系統(tǒng)的推薦質(zhì)量急劇下降。

            5.2 冷啟動問題
            因為傳統(tǒng)的協(xié)同過濾推薦是基于用戶/物品的相似性計算來得到目標用戶的推薦,在一個新的項目首次出現(xiàn)的時候,因為沒有用戶對它作過評價,因此單純的協(xié)同過濾無法對其進行預(yù)測評分和推薦。而且,由于新項目出現(xiàn)早期,用戶評價較少,推薦的準確性也比較差。

            5.3 可擴展性問題
            面對日益增多的數(shù)據(jù)量,算法的擴展性問題成為制約推薦系統(tǒng)實施的重要因素。識別“最近鄰居”算法的計算量隨著用戶和項的增加而大大增加,對于上百萬的數(shù)目,通常的算法會遇到嚴重的擴展性瓶頸問題。

            總結(jié)

            協(xié)同過濾作為一種經(jīng)典的推薦算法種類,在工業(yè)界應(yīng)用廣泛,它的優(yōu)點很多,模型通用性強,不需要太多對應(yīng)數(shù)據(jù)領(lǐng)域的專業(yè)知識,工程實現(xiàn)簡單,效果也不錯。這些都是它流行的原因。

            當(dāng)然,協(xié)同過濾也有些難以避免的難題,比如令人頭疼的“冷啟動”問題,我們沒有新用戶任何數(shù)據(jù)的時候,無法較好的為新用戶推薦物品。同時也沒有考慮情景的差異,比如根據(jù)用戶所在的場景和用戶當(dāng)前的情緒。當(dāng)然,也無法得到一些小眾的獨特喜好,這塊是基于內(nèi)容的推薦比較擅長的,小伙伴們歡迎一起學(xué)習(xí)研究探討。

            標簽:

            上一篇:
            下一篇: