如何在大量文章中根据关键字搜索出相关文章?

如何在大量文章中根据关键字搜索出相关文章?


mysql
数据库
2023-08-02 12:52:48
浏览
收藏 0
回答 1
待解决
回答 1
按赞同
/
按时间
岂因祸福

首先,存储文章这种非结构化数据不太适合用 mysql,建议换一个 nosql 的数据库。

其次,全文搜索如果你想自己搞,大体原理是分词、统计词频、建立索引,这样每次只需要查找索引就行了,会快很多。当然也有成熟的工具,比如开源的 ElasticSearch,很多公司都在用。

想要效果更好,可以来个 NLP + 协同过滤做混合推荐,牛逼哄哄,做到这一步大厂会花百万年薪挖你。

最后,存在文件里是不可能的,磁盘物理操作效率太低。骚年,这种方式在你出生之前就淘汰了。

分享
微博
QQ
微信
回复
2023-08-02 14:26:13
相关问题
数据库入表时无法使用内建关键字
685浏览 • 1回复 待解决
为什么文章审核会对破密进行限制?
3863浏览 • 1回复 待解决
文章对程序员很重要吗?
11004浏览 • 16回复 已解决
为什么文章不能评论,有问题交流
3620浏览 • 1回复 待解决
Search搜索如何配置?
67浏览 • 1回复 待解决
如何在ArkTS合并对象
304浏览 • 1回复 待解决
如何在page获取WindowStage
224浏览 • 1回复 待解决
如何在UI获取UIAbilityContext
1018浏览 • 1回复 待解决
如何在ArkTS合并对象?
478浏览 • 1回复 待解决
如何在UI获取Context
971浏览 • 1回复 待解决
应该如何设计大量线程并发方案
905浏览 • 1回复 待解决
如何在工具类获取Context
814浏览 • 1回复 待解决
如何在openharmony执行js脚本
1504浏览 • 0回复 待解决
如何在TextArea设置最小的高度。
89浏览 • 1回复 待解决
如何在ets引入zlib.js?
1421浏览 • 1回复 待解决
如何在.net应用JMS消息服务?
1082浏览 • 1回复 待解决
如何实现搜索栏历史记录
398浏览 • 1回复 待解决
如何在Stage模型创建后台服务
876浏览 • 1回复 待解决
提问
该提问已有0人参与 ,帮助了0人