如何在大量文章中根据关键字搜索出相关文章?

如何在大量文章中根据关键字搜索出相关文章?


mysql
数据库
2023-08-02 12:52:48
浏览
收藏 0
回答 1
待解决
回答 1
按赞同
/
按时间
岂因祸福

首先,存储文章这种非结构化数据不太适合用 mysql,建议换一个 nosql 的数据库。

其次,全文搜索如果你想自己搞,大体原理是分词、统计词频、建立索引,这样每次只需要查找索引就行了,会快很多。当然也有成熟的工具,比如开源的 ElasticSearch,很多公司都在用。

想要效果更好,可以来个 NLP + 协同过滤做混合推荐,牛逼哄哄,做到这一步大厂会花百万年薪挖你。

最后,存在文件里是不可能的,磁盘物理操作效率太低。骚年,这种方式在你出生之前就淘汰了。

分享
微博
QQ
微信
回复
2023-08-02 14:26:13
相关问题
数据库入表时无法使用内建关键字
838浏览 • 1回复 待解决
为什么文章审核会对破密进行限制?
3901浏览 • 1回复 待解决
为什么文章不能评论,有问题交流
3671浏览 • 1回复 待解决
文章对程序员很重要吗?
11040浏览 • 16回复 已解决
Search搜索如何配置?
88浏览 • 1回复 待解决
如何在ArkTS合并对象
315浏览 • 1回复 待解决
如何在HarmonyOS添加编译参数
36浏览 • 1回复 待解决
应该如何设计大量线程并发方案
953浏览 • 1回复 待解决
如何在page获取WindowStage
232浏览 • 1回复 待解决
如何在ArkTS合并对象?
513浏览 • 1回复 待解决
如何在UI获取UIAbilityContext
1168浏览 • 1回复 待解决
如何在UI获取Context
1084浏览 • 1回复 待解决
如何在TextArea设置最小的高度。
107浏览 • 1回复 待解决
如何在ets引入zlib.js?
1490浏览 • 1回复 待解决
关键资产存储服务问题
710浏览 • 1回复 待解决
如何在openharmony执行js脚本
1558浏览 • 0回复 待解决
如何在工具类获取Context
870浏览 • 1回复 待解决
提问
该提问已有0人参与 ,帮助了0人