如何通过nutch在hbase中添加额外字段?

如何通过nutch在hbase中添加额外字段?,hbase,nutch,Hbase,Nutch,我正在写一个nutch插件。我正在对获取的网页进行一些分析,结果将存储在网页对应的hbase中。我不知道如何添加额外字段以及如何使用nutch将数据写入该字段。如果您想在Solr中编制索引时添加额外字段:: 如果附加字段的值固定(静态),则可以使用Nutch的索引静态插件 它允许您添加许多字段及其内容 第1步: 首先需要在nutch-site.xml中启用index.static属性 第二步: 添加index.static属性 <property> <name>inde

我正在写一个nutch插件。我正在对获取的网页进行一些分析,结果将存储在网页对应的hbase中。我不知道如何添加额外字段以及如何使用nutch将数据写入该字段。

如果您想在Solr中编制索引时添加额外字段::

如果附加字段的值固定(静态),则可以使用Nutch的索引静态插件

它允许您添加许多字段及其内容

第1步:

首先需要在nutch-site.xml中启用index.static属性

第二步:

添加index.static属性

<property>
 <name>index.static</name>
 <value>first_field:value,second_field:value</value>
 <description>
  Used by plugin index-static to adds fields with static data at indexing time. 
   You can specify a comma-separated list of fieldname:fieldcontent per Nutch job.
  Each fieldcontent can have multiple values separated by space, e.g.,
   field1:value1.1 value1.2 value1.3,field2:value2.1 value2.2 ...
   It can be useful when collections can't be created by URL patterns, 
  like in subcollection, but on a job-basis.
  </description>
</property>

静态索引
第一个字段:值,第二个字段:值
插件索引static用于在索引时添加带有静态数据的字段。
可以为每个Nutch作业指定一个以逗号分隔的fieldname:fieldcontent列表。
每个fieldcontent可以有多个由空格分隔的值,例如。,
字段1:value1.1 value1.2 value1.3,字段2:value2.1 value2.2。。。
当无法通过URL模式创建集合时,它会很有用,
类似于子集合,但基于工作。
第三步:

在schema.xml中添加字段定义

第4步:

已在plugin.includes中启用索引


您可以按照以下步骤编写插件

尝试更新schema.xml!!是否要在索引时添加其他字段?是否可以在hbase中添加其他字段?