Warning: file_get_contents(/data/phpspider/zhask/data//catemap/9/solr/3.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Php 通过Solr为内容生成关键字_Php_Solr_Lucene - Fatal编程技术网

Php 通过Solr为内容生成关键字

Php 通过Solr为内容生成关键字,php,solr,lucene,Php,Solr,Lucene,我正在为新的PHP应用程序集成Solr 由于我是solr部分的新手,我想知道是否有可能通过solr为每个内容页生成一些有用的标记?类似自动标记机制的东西 先谢谢你 我的内容有波斯语和英语两种语言 类似自动标记机制的东西 是的,你可以建造这样的东西 有两种不同的方式来实现这一点: 使用构建文档组并按solr标记这些文档。标签有点像你要找的标签 使用该功能实现标记 我用1.)方法启动了一个自动标记项目,取得了中等成功。查找文档集群的标签是一个困难的过程 但幸运的是,我已经有了一些taggegd文档。

我正在为新的
PHP
应用程序集成
Solr

由于我是solr部分的新手,我想知道是否有可能通过solr为每个内容页生成一些有用的标记?类似自动标记机制的东西

先谢谢你

我的内容有波斯语和英语两种语言

类似自动标记机制的东西

是的,你可以建造这样的东西

有两种不同的方式来实现这一点:

  • 使用构建文档组并按solr标记这些文档。标签有点像你要找的标签
  • 使用该功能实现标记
  • 我用1.)方法启动了一个自动标记项目,取得了中等成功。查找文档集群的标签是一个困难的过程
    但幸运的是,我已经有了一些taggegd文档。如果您还有一些带有有效标记的文档,则可以使用2.)方法将这些文档用作开始学习的基础:


    获取一个没有标签的文档,并对带有标签的文档执行MLT搜索。从你喜欢的文件中取出标签,数一数。根据计数,对未标记的文档应用一个或多个标记。就我而言,这很有效。方法2.)是一种基于机器学习的cheep实现,但您只需5%的工作输入就可以获得95%的成功。

    由于它是一个PHP应用程序,如果您可以在PHP中生成标记,然后插入/更新到Solr,这里有几个选项-

    • 如果可以使用web服务,请检查
    • 如果您可以/希望自己托管术语提取服务(可能在本地服务器中),请选中
    • 是一个php函数,用于从文本块中提取有价值的单词。当然没有雅虎术语提取器那么高效,但它可能适合你

    您希望执行自动。这里有一个相关的问题和答案:我真的很想看到第一种方法,你有关于这个功能的例子吗?非常感谢,我尝试在我的
    solr
    应用程序中启用群集,但群集系统在查询中不显示任何指向一个结果的标记@空指针抱歉,但是
    不显示任何标记
    不是有效的错误描述。;-)如果您已经决定使用1.)方法,那么最好开始一个新的SO问题,并提供配置详细信息和详细说明您得到了什么以及希望得到什么。为了熟悉carrotto,我建议您下载并使用carrot2工作台。这对于了解carrot2配置非常有帮助。