php cms 自动分词,灵活运用PHPAnalysis分词组件,实现Phpcms v9关键词自动分词_消费者报道的博客-程序员ITS301

技术标签: php cms 自动分词  

在2019年12月下旬,Phpcms官网phpcms.cn关闭后,原有的分词api接口(http://tool.phpcms.cn/api/get_keywords.php)已经失效,在录入标题后再也不能自动提取关键词到关键词的输入栏了,针对这一问题,CMSYOU在之前的分词经验基础上,做了几个分词系统的分析,最后完善整理出来Phpcms v9关键词自动分词组件,今天在这里与大家分享中文分词的那些事。

一、没有了原来的自动分词获取关键词后怎么办?

Phpcms原有的分词api接口失效后报错

解决方式1:忽视它、或者注释掉,手动录入关键词,这样更精准。

具体方法:修改api/get_keywords.php,把echo get_keywords($data, $number);改成//echo get_keywords($data, $number); 也就是注释掉这一行,不执行操作,这样避免引发报错。

解决方式2:改造它、省事的功能不能停!

如果你之前一直用,一下子没有了,是不是很不习惯?那么自己就动手改造、实现恢复这个自动分词功能!

二、实现Phpcms v9关键词自动分词的方法

解决方式1:如果你对Php程序或者Phpcms不熟悉,可以选择Phpcms v9关键词自动分词组件,省事的办法,也省时。

Phpcms v9关键词自动分词组件截图

解决方式2:自己动手改造。

当前市面上,常见的分词工具组件有ICTCLAS、HTTPCWS、SCWS、PhpanAlysis、MMSEG4J、IKAnalyzer、盘古分词这些,其中号称最强大的ICTCLAS汉语分词系统不开源,SCWS开源免费但需要对PHP环境安装php_scws.dll拓展、限制了一部分用户。此外,CMSYOU觉得PhpanAlysis不错,比较轻量,准确度也比较好,大家可以深入研究。如果服务器支持,可以考虑开源的SCWS中文分词,以下是SCWS的介绍:

SCWS 是 Simple Chinese Word Segmentation 的首字母缩写(即:简易中文分词系统)。

这是一套基于词频词典的机械式中文分词引擎,它能将一整

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://blog.csdn.net/weixin_34984088/article/details/115814069

智能推荐

JAVA线上运行结果_给定 java 代码如下,编译运行后,输出结果是 (  ) 。 public classtest { static int i; public int aMethod() { i..._weixin_39546661的博客-程序员ITS301

【判断题】369 . 为了正面美观,裙子侧缝 不应 靠前而应靠后。【判断题】364 . A 字裙的侧缝线有一定的偏斜度,裙腰口一般无省。【判断题】393 . 扎包大片放外面,零部件裹里面,每包扎好在包里吊上标签和标号。【单选题】99 . 直裙下摆摆衩的净宽为( ) cm 。【判断题】379 . 人体比例最简单,最方便的测量单位是头。【判断题】382 . 实量制图法只需很少的测量数据,较为简便。【单...

android 开发艺术探索-笔记_NO Exception?的博客-程序员ITS301_linktodeath内存泄露

View 事件体系view 位置有左上角和右下角来确认view的位置 top left right botttom,这些都是相对父容器来说。从Android 3.0 ,view增加了x ,y translationx,translationy ,x和y是左上角的坐标,而translationx,translationy 是左上角相对于父容器的偏移量。MotionEventgetX getY是当前点击的位置相对于当前view的坐标。getRawXgetRawY是相对于屏幕左上角的坐标。Touch

AI开发平台系列1:AI开发平台“家族”概览_「已注销」的博客-程序员ITS301

AI技术蓬勃发展,已逐渐渗透进国民经济的各行各业。但企业在AI技术的应用仍面临数据、算法、技术等方面的挑战,需专业AI开发与计算工具帮助企业降低AI应用门槛,加速创新。在此趋势下,AI开发平台纷纷涌现。白海科技将通过系列文章,梳理典型AI开发平台,并对其技术与功能进行对比分析,为广大企业与行业伙伴揭开AI开发平台的神秘面纱

JS前端加密 后端java解密_十六夜之彼岸舞的博客-程序员ITS301

问题背景:  前几天项目做渗透测试的时候出现了两个高危漏洞经过排查发现是因为前端在登录的时候没有对密码等用户信息做加密处理解决方案:  做一下最简单的处理,前端采用JS自带的atob加密,后端采用工具解密前端JS代码://加密字符串,可以先将中文加密,然后再用btoa加密 encryption(str) { var encStr = encodeU...

EBS OAF R12.2开发中Jar包签名不一致问题的处理_tavor的博客-程序员ITS301

EBS OAF R12.2开发中Jar包签名不一致问题的处理(版权声明,本人原创或者翻译的文章如需转载,如转载用于个人学习,请注明出处;否则请与本人联系,违者必究)在开发阶段,经常需要调试类来帮助产品开发组来开发和测试java代码。但因为java代码在EBS都保存为压缩包格式(通过adadmin生成的签名的JAR包),所以必须在加载原本产品的JAR文件之前来加载调试类到classpath。我们可以

dtft频移性质_08 DTFT变换的性质_weixin_39685697的博客-程序员ITS301

DTFT变换的性质线性性质设 $$ x[n]\xrightarrow{DTFT}X(e^{jw})\quad y[n]\xrightarrow{DTFT}Y(e^{jw})​ $$则 $$ \begin{aligned}ax[n]+by[n]&\xrightarrow{DTFT}\sum_{n=-\infty}^{\infty}(ax[n]+by[n])e^{-jwn} \ &=...

随便推点

解决CentOS6 yum安装transmission设置不保存无法设置密码_天涯霜雪霁寒宵的博客-程序员ITS301

本文讲述了在centos6下yum安装transmission transmission-daemon时,设置文件无法正常保存,需要认证的配置不生效,不能使用帐号密码登录transmission管理网页的问题。

Linux单机到Linux单机的OGG安装部署步骤(支持DDL)_auspicious航的博客-程序员ITS301_linux部署ogg

OGG安装部署步骤(linux单机对linux单机支持DDL)检查Goldengate通过抓取源端数据库重做日志进行分析,将获取的数据应用到目标端,实现数据同步。因此,源数据库需要必须处于归档模式,并启用附加日志和强制日志。1.1 查看源端数据库是否开启归档$ sqlplus / as sysdbaSQL> archive log list;如果是非归档模式,需...

hyperic _iteye_8381的博客-程序员ITS301

http://www.springsource.com/downloads/hyperic-open-source-downloads?sid=972657   http://www.hyperic.com/products/enterprise-systems-monitoring  [原创]MySQL监控 MySQL是最流行的开放源代码关系数据库系统。其性能和易...

(转)Illustrated: Efficient Neural Architecture Search ---Guide on macro and micro search strategies i..._a1424262219的博客-程序员ITS301

Illustrated: Efficient Neural Architecture Search--- Guide on macro and micro search strategies inENAS2019-03-2709:41:07This blog is copied from:https://towardsdatascience.com/illustr...

java与模式pdf 闫宏_Java设计模式及实践.pdf下载_牛站长的博客-程序员ITS301

Java设计模式及实践.pdf下载资料简介:本书向读者展示Java语言中更加智能化的编码实例。书中首先介绍面向对象编程(OOP)和函数式编程(FP)范式,然后描述常用设计模式的经典使用方法,并解释如何利用函数式编程特性改变经典的设计模式。读者将学习混合使用OOP和FP的实现方式,然后学习响应式编程模型——一种为了编写更好的代码而将OOP和FP结合使用的方法。之后,本书将介绍从MVC架构向微服务和无...

Linux开发——原始套接字_此人未设置昵称的博客-程序员ITS301

基于原始套接字的协议SOFP ICMP STCP MPLS op-vpn GRE rip ARR DHCP PPPOE EIGRP VPN原始套接字内核实现socket sys_socketcall call SYS_SOCKET原始套接字目标1,...

推荐文章

热门文章

相关标签