毕业设计:python招聘推荐系统 协同过滤推荐算法 数据分析 可视化 Django框架 boss直聘 大数据技术✅
毕业设计:python招聘推荐系统 协同过滤推荐算法 数据分析 可视化 Django框架 boss直聘 大数据技术✅
博主介绍:✌全网粉丝10W+,前互联网大厂软件研发、集结硕博英豪成立工作室。专注于计算机相关专业毕业设计项目实战6年之久,选择我们就是选择放心、选择安心毕业✌感兴趣的可以先收藏起来,点赞、关注不迷路✌
1、毕业设计:2025年计算机专业毕业设计选题汇总(建议收藏)✅
1、项目介绍
技术栈:
Python、MySQL数据库、Django框架、Echarts可视化、基于用户和基于物品的协同过滤推荐算法、HTML技术
2、项目界面
(1)系统首页
(2)岗位详情页
(3)可视化分析1
(2)可视化分析2
(3)可视化分析3
(4)可视化分析4
(5)个人信息页面
(6)后台数据管理
(7)注册登录
3、项目说明
该系统是一个智能化的招聘推荐平台,旨在帮助企业快速找到合适的人才,同时帮助求职者更精准地匹配到符合自己能力和兴趣的职位。系统采用了先进的技术栈,包括Python作为开发语言,MySQL作为数据库存储,Django框架用于构建后端服务,Echarts用于数据可视化,以及HTML用于前端页面展示。
在功能方面,该系统首先通过数据爬虫技术从各大招聘网站抓取职位信息,并使用MySQL数据库进行存储。这些信息包括职位名称、工作地点、薪资范围、学历要求等关键信息。同时,系统还记录了用户的搜索和点击行为,以便进行个性化的推荐。
系统的核心在于协同过滤推荐算法。该算法分为基于用户的协同过滤和基于物品的协同过滤两种。基于用户的协同过滤算法通过分析用户的历史行为和偏好,找到与目标用户相似的其他用户,并根据这些用户的职位喜好来推荐职位。而基于物品的协同过滤算法则通过分析职位的特性和用户评价,找到与目标职位相似的其他职位,并向用户推荐。
为了提升用户体验,系统还采用了Echarts进行数据可视化。通过柱状图、饼状图等图表形式,用户可以直观地看到职位的分布情况、学历要求分析等信息。这些可视化数据不仅有助于用户更好地了解市场趋势,还能为他们的求职决策提供参考。
在前端页面展示方面,系统采用了HTML技术,为用户提供了简洁明了的操作界面。用户可以通过系统首页浏览推荐的职位,也可以通过搜索功能快速找到符合自己条件的职位。同时,系统还支持用户注册和登录功能,以便记录用户的个人信息和偏好,从而提供更精准的推荐服务。
总的来说,该系统通过先进的技术栈和智能的推荐算法,为企业和求职者提供了一个高效、精准的招聘推荐平台。
4、核心代码
# -*-coding:utf-8-*-
import os
os.environ["DJANGO_SETTINGS_MODULE"] = "recommend.settings"
import django
django.setup()
from item.models import *
from math import sqrt, pow
import operator
from django.db.models import Subquery, Q, Count
# from django.shortcuts import render,render_to_response
class UserCf:
# 获得初始化数据
def __init__(self, all_user):
self.all_user = all_user
# 通过用户名获得列表,仅调试使用
def getItems(self, username1, username2):
return self.all_user[username1], self.all_user[username2]
# 计算两个用户的皮尔逊相关系数
def pearson(self, user1, user2): # 数据格式为:岗位id,浏览此
sum_xy = 0.0 # user1,user2 每项打分的成绩的累加
n = 0 # 公共浏览次数
sum_x = 0.0 # user1 的打分总和
sum_y = 0.0 # user2 的打分总和
sumX2 = 0.0 # user1每项打分平方的累加
sumY2 = 0.0 # user2每项打分平方的累加
for job1, score1 in user1.items():
if job1 in user2.keys(): # 计算公共的浏览次数
n += 1
sum_xy += score1 * user2[job1]
sum_x += score1
sum_y += user2[job1]
sumX2 += pow(score1, 2)
sumY2 += pow(user2[job1], 2)
if n == 0:
# print("p氏距离为0")
return 0
molecule = sum_xy - (sum_x * sum_y) / n # 分子
denominator = sqrt((sumX2 - pow(sum_x, 2) / n) * (sumY2 - pow(sum_y, 2) / n)) # 分母
if denominator == 0:
return 0
r = molecule / denominator
return r
# 计算与当前用户的距离,获得最临近的用户
def nearest_user(self, current_user, n=1):
distances = {}
# 用户,相似度
# 遍历整个数据集
for user, rate_set in self.all_user.items():
# 非当前的用户
if user != current_user:
distance = self.pearson(self.all_user[current_user], self.all_user[user])
# 计算两个用户的相似度
distances[user] = distance
closest_distance = sorted(
distances.items(), key=operator.itemgetter(1), reverse=True
)
# 最相似的N个用户
print("closest user:", closest_distance[:n])
return closest_distance[:n]
# 给用户推荐岗位
def recommend(self, username, n=3):
recommend = {}
nearest_user = self.nearest_user(username, n)
for user, score in dict(nearest_user).items(): # 最相近的n个用户
for jobs, scores in self.all_user[user].items(): # 推荐的用户的岗位列表
if jobs not in self.all_user[username].keys(): # 当前username没有看过
if jobs not in recommend.keys(): # 添加到推荐列表中
recommend[jobs] = scores*score
# 对推荐的结果按照岗位
# 浏览次数排序
return sorted(recommend.items(), key=operator.itemgetter(1), reverse=True)
# 基于用户的推荐
def recommend_by_user_id(user_id):
user_prefer = UserTagPrefer.objects.filter(user_id=user_id).order_by('-score').values_list('tag_id', flat=True)
current_user = User.objects.get(id=user_id)
# 如果当前用户没有打分 则看是否选择过标签,选过的话,就从标签中找
# 没有的话,就按照浏览度推荐15个
if current_user.rate_set.count() == 0:
if len(user_prefer) != 0:
job_list = xiangmu.objects.filter(tags__in=user_prefer)[:15]
else:
job_list = xiangmu.objects.order_by("-c9")[:15]
return job_list
# 选取评分最多的10个用户
users_rate = Rate.objects.values('user').annotate(mark_num=Count('user')).order_by('-mark_num')
user_ids = [user_rate['user'] for user_rate in users_rate]
user_ids.append(user_id)
users = User.objects.filter(id__in=user_ids)#users 为评分最多的10个用户
all_user = {}
for user in users:
rates = user.rate_set.all()#查出10名用户的数据
rate = {}
# 用户有给岗位打分 在rate和all_user中进行设置
if rates:
for i in rates:
rate.setdefault(str(i.job.id), i.mark)#填充岗位数据
all_user.setdefault(user.username, rate)
else:
# 用户没有为岗位打过分,设为0
all_user.setdefault(user.username, {})
user_cf = UserCf(all_user=all_user)
recommend_list = [each[0] for each in user_cf.recommend(current_user.username, 15)]
job_list = list(xiangmu.objects.filter(id__in=recommend_list).order_by("-c9")[:15])
other_length = 15 - len(job_list)
if other_length > 0:
fix_list = xiangmu.objects.filter(~Q(rate__user_id=user_id)).order_by('-collect')
for fix in fix_list:
if fix not in job_list:
job_list.append(fix)
if len(job_list) >= 15:
break
return job_list
# 计算相似度
def similarity(job1_id, job2_id):
job1_set = Rate.objects.filter(job_id=job1_id)
# job1的打分用户数
job1_sum = job1_set.count()
# job_2的打分用户数
job2_sum = Rate.objects.filter(job_id=job2_id).count()
# 两者的交集
common = Rate.objects.filter(user_id__in=Subquery(job1_set.values('user_id')), job=job2_id).values('user_id').count()
# 没有人给当前岗位打分
if job1_sum == 0 or job2_sum == 0:
return 0
similar_value = common / sqrt(job1_sum * job2_sum)#余弦计算相似度
return similar_value
#基于物品
def recommend_by_item_id(user_id, k=15):
# 前三的tag,用户评分前三的岗位
user_prefer = UserTagPrefer.objects.filter(user_id=user_id).order_by('-score').values_list('tag_id', flat=True)
user_prefer = list(user_prefer)[:3]
print('user_prefer', user_prefer)
current_user = User.objects.get(id=user_id)
# 如果当前用户没有打分 则看是否选择过标签,选过的话,就从标签中找
# 没有的话,就按照浏览度推荐15个
if current_user.rate_set.count() == 0:
if len(user_prefer) != 0:
job_list = xiangmu.objects.filter(tags__in=user_prefer)[:15]
else:
job_list = xiangmu.objects.order_by("-c9")[:15]
print('from here')
return job_list
# most_tags = Tags.objects.annotate(tags_sum=Count('name')).order_by('-tags_sum').filter(job__rate__user_id=user_id).order_by('-tags_sum')
# 选用户最喜欢的标签中的岗位,用户没看过的30部,对这30部岗位,计算距离最近
un_watched = xiangmu.objects.filter(~Q(rate__user_id=user_id), tags__in=user_prefer).order_by('?')[:30] # 看过的岗位
watched = Rate.objects.filter(user_id=user_id).values_list('job_id', 'mark')
distances = []
names = []
# 在未看过的岗位中找到
for un_watched_job in un_watched:
for watched_job in watched:
if un_watched_job not in names:
names.append(un_watched_job)
distances.append((similarity(un_watched_job.id, watched_job[0]) * watched_job[1], un_watched_job))#加入相似的岗位
distances.sort(key=lambda x: x[0], reverse=True)
print('this is distances', distances[:15])
recommend_list = []
for mark, job in distances:
if len(recommend_list) >= k:
break
if job not in recommend_list:
recommend_list.append(job)
# print('this is recommend list', recommend_list)
# 如果得不到有效数量的推荐 按照未看过的岗位中的热度进行填充
print('recommend list', recommend_list)
return recommend_list
if __name__ == '__main__':
# similarity(2003, 2008)
print(recommend_by_item_id(1799))
🍅✌感兴趣的可以先收藏起来,点赞关注不迷路,想学习更多项目可以查看主页,大家在毕设选题,项目代码以及论文编写等相关问题都可以给我留言咨询,希望可以帮助同学们顺利毕业!🍅✌
5、源码获取方式
🍅由于篇幅限制,获取完整文章或源码、代做项目的,拉到文章底部即可看到个人联系方式。🍅
点赞、收藏、关注,不迷路,下方查看👇🏻获取联系方式👇🏻

魔乐社区(Modelers.cn) 是一个中立、公益的人工智能社区,提供人工智能工具、模型、数据的托管、展示与应用协同服务,为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作,由全产业链共同建设、共同运营、共同享有,推动国产AI生态繁荣发展。
更多推荐
所有评论(0)