多讯php中文分词扩展 v0.1 |
2021-01-21 17:58:40 35资源网(www.35d.net) |
php |
下载本资源原文网址:http://www.daima.org/php/php7194.html 专业提供中文分词PHP扩展和中文词库。使中文分词,全文搜索不再是难点,一个php函数即完成分词。然后即可把分词后的结果存储,再使用sphinx,Lucene等进行索引搜索了。
安装说明
1。 若服务器为Windows系统,复制PHP扩展包中php_duoxun5.dll到php安装 目录下ext文件夹中(默认为此位置,具体以php.ini中extension_dir定义位 置为准) 2。 若服务器为Linux系统,复制PHP扩展包中duoxun5.so到php安装目录下 lib/php/extensions/no-debug-non-zts-20060613/文件夹或 lib/php/extensions/no-debug-non-zts-20090626/文件夹中(具体以php.ini 中extension_dir定义位置为准) 3。 编辑php.ini,添加extension=php_duoxun5.dll(Windows)或 extension="php_duoxun5.so"(Linux) 4。 重启Web服务。 5。 下载中文词库,并上传到服务器(任何位置均可) 6。 中文分词交流QQ群:37523749。若有疑问或需要帮助,请加群交流讨论。
使用说明 1。 在phpinfo()显示页面查找到如下图信息,则表示PHP扩展安装成功
2。 演示代码,如下图
显示结果,如下图
参数:函数duoxun_fenci(),共三个参数。第一个参数:要进行分词的语句,第二个参数:多讯中文词库路径,
第三个是否进行一元分词,该参数可选,默认值为0,即不进行一元分词。
建议:对添加到数据库的分词包含一元分词然后进行索引,然后对要查询的词语先进行不包含一元分词的分词
(使搜索结果更精准),若没有搜索到查询记录,再进行包含一元分词的分词,再查询一次(以便在词库没有某
词语,也能搜索到结果,但可能无用信息会比较多)。 3。 OK,中文分词就这样简单。现在可以把分词后的结果存入数据库,然后使用sphinx,Lucene等进行索引并搜索了。 |
|
|
|
资源大全_资源下载网站:www.35d.net 本站资源仅限研究学习使用,如需商用请联系版权方, 本站事务联系QQ:939804642
|
|