网站上的搜索功能看起来很糟糕
是否有任何外部网站在使用标签等对项目进行分类方面做得更好
或者我只是没有正确地使用GitHub?我还没有尝试过这个,但我知道谷歌在搜索网站方面通常比网站自己的搜索工具做得更好。你试过了吗
转到他们的页面,在“仅返回此站点或域的结果”栏中填写github.com。您是否尝试过谷歌搜索,搜索中包含站点:github.com?更好
GitHub的搜索功能非常糟糕。我完全支持每个人都有自己的观点,但对于这样一个几乎在所有其他方面都做得很好的网站,没有理由缺少基本的排序选项。
我正在使用GoogleAjaxRESTAPI,我希望通过前缀获得本地结果。例如:我输入“sta”,得到“星巴克”
我想知道是否有一个文档化的或未文档化的通配符运算符允许您查找以字符串开头的结果
我知道谷歌确实有一个通配符操作符,但它可以逐字操作
基础。像这样:星巴克*=>星巴克咖啡
下面是一个谷歌搜索运营商的列表,其中没有一家提供以下功能:
多谢各位 可能不是您想要听到的答案,但我可以合理地确定,您正在寻找的内容不受支持。您正在寻找的是用于本地搜索的Google Suggest API。鉴于谷歌
这是一个如何为基于CMS系统的用户设计最佳搜索体验的问题。它在内部网系统上。
用户需要能够根据文档/信息的位置过滤搜索结果,并能够搜索/过滤其他元数据,如作者、创建日期和其他字段
我想的是让用户在点击搜索之前过滤,或者让他们在执行搜索后过滤结果页面上的结果。
后者可能会使用基于Ajax的机制进行设计,该机制根据结果的选择实时更新结果
你的想法是什么?
从用户的角度来看,什么是最好的可用性体验
这是关于系统上的高级搜索页面。还有一个简单的搜索web控件,但这是关于如何设计高级搜索的。我想说两者都有
我有一个目标
Title : foo
Summary : foo bar
Body : this is a published story about a foo and a bar
这三个字段都设置为存储=true的字段
用户在我的系统中搜索单词
"foo"
我想在这三个地方强调foo
用户在标题中搜索单词foo
"title:foo"
我只想在标题中突出显示foo
当我加上
hl.requirefeldmatch=true和hl.usePhraseHighlighter=tr
我正在为一个网站定制搜索功能。我很好奇,如果在我的语料库中只使用tf idf对文档进行排名,是否也有助于对具有多个搜索词的文档进行加权,而不是对只有一个搜索词的文档进行加权
示例:Search=“波兰泉水”
理论上,如果a文档包含100次“波兰”和零次“水”,那么上述查询(使用传统的tf-idf)的权重会更高吗。或者,如果一份文件包含10倍的“波兰”和10倍的“水”,那么它的重量会更重吗
我知道这一切都取决于tf idf值“poland”和“water”,但从理论上讲,在一个公平的竞争环境中,如
gVim中是否有功能、插件或方法来显示匹配搜索词的标记,指出它们在缓冲区中的大致位置?例如,在缓冲区中搜索“foo”时,该功能会将标记与垂直滚动条一起放置。每个标记表示一个匹配的“foo”。当您滚动到该位置时,您会在缓冲区中看到一个“foo”。有了这个特性,我可以很容易地直观地说出术语的分布模式,当前术语在文档中的相对位置,以及出现的次数
若并没有这样的功能,有并没有办法在插件中操纵滚动条和gVim的其他GUI组件
在Firefox中,类似的功能是通过(过时的)、(过时的)或(最新的)扩展来实现
在Lucene中,我想在数字字段上构建一个“模糊”查询。目前我只找到了搜索数字字段的类。在我正在构建的应用程序中,用户需要指定一组类型以及他希望在特定集合中出现的此类对象的数量。例如,用户可以查询“4个汤匙、13个叉子和1把刀”
我需要一个查询,根据所需金额和实际金额的距离为每个数字字段打分。例如,score=(距离+1)^-1应该会产生很好的结果。有没有一种简单有效的方法可以做到这一点?a应该做你想做的事情。
它允许您将任意数据附加到每个术语,然后可以在搜索过程中检索这些数据,以实现评分、匹配
我用富文本字段“正文”创建了灵巧内容类型。我想让我的Plone 4.0.2可以搜索“正文”全文
我在我的主题中添加了catalog.xml,代码如下
我从ZMI/portal/portal\u目录“body\u text RichTextValue对象”(您是指.raw还是.output?)收到错误消息
如何将catalog.xml更改为使用.output,我尝试过,但没有成功
谢谢 免责声明:我自己没有遇到过这个问题,所以这只是一个猜测
原型和其他类型使用SearchableText()索引
当我将多个查询与Lucene.net(版本2.9)的布尔查询相结合时,我遇到了问题
请参阅我索引的文档结构
ID Make Model Price MakeDate CreatedBy
1 Ford Fiesta 240000 06/23/2011 anil
2 Ford Focus 250000 06/20/2011 anil
3 Vauxhall Astra 200000 06/21/2011
我的目标是检索来自爱尔兰、新西兰、立陶宛等小国的所有推文,或者尽可能多地检索
Twitter的搜索API允许在给定lat/long的半径范围内搜索状态。Twitter通过用户配置文件中包含的地理标签数据,或者通过对用户配置文件中的家乡位置进行反向地理编码,来决定返回哪些结果
流API中的公共状态流可以通过geobox进行过滤,但Twitter在返回这些结果时不会执行反向地理编码。迄今为止的研究表明,在这些国家使用地理标记的人并不多
显然,如果我能够访问firehose流,那么使用流API将是一条
我有一个XPages数据库准备好了,但我想制作一个搜索页面/栏来搜索我的数据库并显示链接信息。由于我是XPAGES的初学者,我希望得到一个逐步的指导:)或者如果您知道任何有指导的网站,我希望得到任何帮助:)可以在这里找到实现搜索功能的说明:
其他感兴趣的网站:
可以在以下位置找到实现搜索功能的说明:
其他感兴趣的网站:
使用extlib.openntf.org-应用程序布局控件已准备好使用搜索栏条目使用extlib.openntf.org-应用程序布局
有人知道如何定位Amazon AWS ItemSeach,使其只在产品标题中搜索吗?我正在使用关键字,但返回的结果只是模糊相关
此示例在“视频游戏”的“附件”节点(676172011)中搜索“无线耳机xbox”:
&Operation=ItemSearch
&SearchIndex=VideoGames
&ItemPage=1
&BrowseNode=676172011
&Sort=salesrank
&Keywords=Wireless%20he
在Windows 7上,文件夹搜索框中使用的以下查询无法筛选文件夹中带有“!”感叹号的文件
filename:!
请问有没有办法做这个搜索?谢谢。在您的特定示例中文件名:“*!*”似乎在Win7中工作(对Vista不太确定)
我仍然建议使用第三方工具,例如,或者如果您需要搜索具有奇怪名称的文件或Windows未编入索引的文件内容。(在Win9x/NT5上,您可以键入Win+F*.dllTabCreateThreadEnter,您将在所有本地驱动器上找到包含字符串“CreateThread”的
我有三门课,顾问课和工作课。
我想创建一个搜索框,从中可以搜索“当然”、“顾问”和“工作水泥”类字段。看看可搜索插件。它是为类似这样的东西而构建的,应该可以让您轻松获得许多强大的功能。看看这个可搜索的插件。它是为类似这样的东西而构建的,应该可以轻松获得许多强大的功能。这个问题已经用这个答案回答了,这个问题已经用这个答案了
在Notepad++中,是否有一个特殊的字符可以在搜索中只给我小写字母?Notepad++支持搜索正则表达式。您可以在文件中搜索[a-z]。这将查找任何单个小写字符
您可以展开正则表达式以使其更具体—例如某些小写字符。我已经进行了编辑。我想说的是,我正在寻找一个特殊的字符,它可以表示任何小写字母,例如\d表示一般数字。否。正则表达式语言对此没有字符类。他们有一个用于“单词字符”,但其中包括大写和其他一些。感谢您的快速回复。这个问题离结束只有几票之遥。我不知道什么需要详细说明。
当用户输入文本“search:”get-Erease时,我试图向searchField添加一个默认标签。我试过这个
editedField.setLabel("search:")
但它不起作用,因为当我放入字符串搜索时,不会删除。例如,如果我输入“a”,它将显示searcha。你能帮我吗?thanx很多。重写方法,当字段聚焦时,清除其内容
要设置文本字段内容,请使用方法,而不是使用设置标签-
private String test="";
final EditField email_edit
我正在评估Solr 4.0和Elastic Search 0.20.5的linkedin类型搜索,并想知道如何存储用户配置文件的规范化数据,这在使用嵌套文档的elasticsearch中很容易实现
例如
个人Json
{
first_name: abc,
last_name: xyz,
school: [{
name: some school,
degree: x-Degree,
startDate:12-02-2009
},
搜索引擎的相关性排名和推荐系统有什么区别
不要同时尝试并达到相同的目的,即为用户找到最相关的项目?不,有两种不同的分析级别
在搜索引擎中,查找数据集合以获取与查询匹配的数据。即使所有结果都相同,或者结果每天都没有变化。非常像一种特殊形式的数据库
在推荐系统中,使用有关您的信息来提供有关搜索数据的特定改进内容。很像一个熟悉你的仆人,为你使用搜索引擎
Beward,一些从web搜索引擎开始的工具现在更像是推荐系统。搜索引擎和推荐系统之间有一个主要区别:
在搜索引擎中,用户知道他在寻找什么,并进行查询
我希望在标准dnn安装中修改返回的搜索结果。当前,它正在显示页面、更新和源
我需要删除最后两个字段。如何做到这一点
谢谢有几种方法可以做到这一点。“最快”的方法是将其添加到portal.css或其他.css文件中
.dnnSearchResultItem-Others {display: none;}
否则,我相信您可以通过本地化文件来管理,但我还没有检查。您使用的是哪个版本的DNN?
我们拥有HDFS中所有服务器的日志文件,其目录格式为yyyy MOUNT/yyyy MOUNT day/yyyy MOUNT day hr MINUTION second,这些文件通过Apache Flume传输到HDFS
例如:
分区\月\日\ utc=2013-12/分区\日\ utc=2013-12-01/分区\分钟\桶=2013-12-01-00-00/cdc-hpcblx002-03 \日志单\ 1.138588809507.txt
文件日志格式:
DATE TIME HOSTNAM
因此,我正在创建一个查找产品的网站,我想知道是否有可能进行搜索,例如,您想在哪里购买笔记本电脑,并且有一个复选框,上面写着“Intel CPU”和“AMD CPU”,一旦您标记了您想要的所有规格,它将在特定笔记本电脑上为您提供这些规格的搜索结果!很抱歉,我的问题太长了,但有可能吗?我该怎么做
谢谢
Reese.好吧,每当用户单击复选框并从php返回列表(将连接到数据库)并更新列表时,您总是可以发送ajax请求。很多网站都使用这个功能
标签: Search
lockingelasticsearch
我有一台运行Elasticsearch 0.9的EC2服务器和一台用于读/写访问的nginx服务器。我的索引有大约750k个中小型文档。我对内容有一个相当连续的最小写入流(主要是更新)。搜索的速度/一致性对我来说很好,但我有时会遇到超时问题
在我的应用程序的某些页面上,我们的服务器将请求一打到几千个文档的多次获取(这通常需要不到1-2秒)。失败的请求会导致nginx服务器超时30000毫秒。我假设发生这种情况是因为出于写入/优化目的临时锁定了索引。有人知道我在这里能做什么吗
一个临时解决方案是降
如果我搜索“agua”,没有忽略搜索中的重音(á,ã,ç)的结果
#城市数据库(id、名称、用友、省id)
1Águas Clara PR 3
2águas PR 4
3Áraguaia PR 3
#schema.xml
<fieldType name="text" class="solr.TextField" omitNorms="false">
<analyzer type="index">
<tokenizer class="solr.Standa
标签: Search
Solr
full-text-searchuser-inputsolr-boost
我希望SolR能够从我的网站用户的选择中“学习”。我的意思是,我知道用户在执行搜索后单击了哪个产品。因此,我收集了SolR中索引的每个产品的[term searched=>number of clicks]列表。但是我不知道如何根据用户的输入来提高性能。是否可以为文档索引一些键/值对,并使用boost参数中可用的函数检索值
我不确定是否清楚,因此我将添加一个具体示例:
比如说,当用户搜索“花园椅”时,SolR会返回3种产品,“绿色花园椅”、“蓝色椅子”和“hamac for garden”。
“
我正在使用Solr从数据库中搜索和索引产品。产品有两个有趣的字段:名称和描述。产品名称通常是唯一的,但有时包含常用词,作为产品的预描述。一个例子是“UltraScrew——一种电动螺丝刀”。名字通常比描述要短得多
问题是,当人们搜索一个公共术语时,名称中包含该术语的文档会比仅在描述中包含该术语的文档得到不必要的提升。这是因为名称较短,即使之后添加了规范化,它也非常明显
我想知道是否有可能从名称中过滤出术语,而不是使用停止词词典,而是基于术语的相对文档频率。这意味着,如果一个术语出现在超过10%的
正如标题所说,我想知道如何在windows批处理脚本中使用for循环在指定目录中搜索指定文件。我不能使用任何第三方软件
以下是我目前的情况:
for /R "%loc%" %%f in ("%searchterm%") do (
echo %%f
echo %%f>> "%genloc%wefound.txt"
)
%loc%是它应该搜索的位置
%searchterm%是脚本经常搜索的文件(例如“hello.txt”)
它必须将屏幕上找到的任何文件(包括其完整路径)输出到wefou
我们有一个客户正在使用谷歌搜索设备(GSA)搜索数千个PDF文件。PDF文件位于子文件夹中组织的文件共享上。它定期查找新文件并将其添加到数据库中
GSA还不够好,所以现在他们需要替代品。例如,他们的GSA无法在PDF中正确搜索垂直文本。我们已经研究了ApacheLucene和Solr以及Tika和ExtractingRequestHandler
我已经启动并运行了Solr示例,并添加了一个使用curl的PDF文件,该文件甚至可以搜索垂直文本。我们的客户希望应用程序自动检测新文件;如果我能每15分
这是我的Lucene.Net示例`
using Lucene.Net.Analysis;
using Lucene.Net.Analysis.Standard;
using Lucene.Net.Documents;
using Lucene.Net.Index;
using Lucene.Net.QueryParsers;
using Lucene.Net.Search;
using Lucene.Net.Store;
using System;
using System.Collection
这个问题不言自明
请问,有谁能告诉我如何用简单有效的方法按名称(不带扩展名)检查文件的存在性。若文件夹中有多个同名文件,那个么若代码返回多个实例,那个就太好了
例如:
folder/
file.html
file.md
更新:
官方文档中没有明确说明如何使用filepath.Match()或filepath.Glob()函数之一。下面是一些例子:
matches, _ := filepath.Glob("./folder/file*") //returns paths
使用Elasticsearch,我使用自定义映射和自定义分析程序集创建了一个索引,但是我无法对_all字段进行查询搜索
我正在使用这些分析仪:
{
"analysis": {
"analyzer": {
"case_insensitive": {
"type": "custom",
"tokenizer": "keyword",
"filter": [
我想在Lucene中搜索部分单词和短语的唯一方法是使用ngramtokenizer。如果还有其他方法,请提出建议。我是一名C#程序员,对lucene和java编程还不熟悉。我正在使用EclipseIDE和Lucene5.3.0。我设法创建了一个文本文件的lucene索引,并使用standardanalyzer和englishanalyzer在其中进行搜索,但在索引ngram标记时遇到了错误。我在网上列举了几个例子,但都不管用。我需要一个简单明了的例子,说明如何在lucene 5.3.0中使用ng
我需要得到每年按公司分组的结果。
我尝试了以下查询:
http://localhost:8080/solr/select?q=&fq=status_created_at:[2011-12-31T4:00:00Z TO 2016-04-13T4:00:00Z] AND -company:(20 26 27 536)&facet=true&facet.field=company&facet.date=status_created_at&facet.date.s
我有一个关于酒店的应用程序,我有一个样板房,房间类型:
room.rb
class Room < ApplicationRecord
enum status: {freeing: true, using: false}
belongs_to :room_type
但这对我不起作用。希望大家能帮助我!
非常感谢。对不起,在room_type.rb:class RoomType
我在索引中使用了少量的StoredField和少量的TextField(Lucene 6.2.1)
对于每个文档,我都有自己的唯一ID
如果我将字段创建为
Field docID = new TextField("docID", docId, Field.Store.YES);
Field docID = new SttoredField("docID", docId);
我能够删除如下文档
Field transactionIdField = new TextField("transa
我从带有多个HTML标记的数据库中获取一个字符串,并希望在终端中显示带有颜色的标记单词。我尝试了Perl6,但找不到有效的解决方案。以下是我尝试过的步骤:
use v6;
use Terminal::ANSIColor;
my $str = "Text mit einem <i>kursiven</i> und noch einem <i>schrägen</i> Wort.";
my $str1 = "Text mit einem { c
我想得到一个子集合的和。例如,我会按智能手机分组,按运营商分组,然后是该运营商的平均价格。我想得到特定智能手机的所有运营商的所有价格总和。所以本质上,我想要这样的东西:
{
"aggs": {
"group_by_smartphones": {
"terms": {
"field": "smartphone",
"order": {
"_term": "asc"
},
"size": 20
我已经用ngram analyzer在索引中的所有字段上创建了一个索引,并且自定义了所有字段。在索引了一些文档之后,我尝试对索引进行查询,以获得类似建议的功能
查询的输出不会返回结果,但不会突出显示
分析仪设置:
"analysis": {
"analyzer": {
"my_edgegram_analyzer": {
"filter": [
"lowercase"
],
"tokenizer": "my_edge_tokenize
我使用SOLR在我的应用程序中存储搜索使用的文档。SOLR由多个应用程序共享,数据根据每个应用程序唯一的应用程序id进行分组
为了根据TF-IDF计算分数,SOLR使用其中可用的全部文档。如何更改该配置以仅根据应用程序id的可用文档总数检查IDF,而不是计算应用程序中的所有文档。如果将它们存储在一个集合中,恐怕内置功能无法实现
我认为您有几种选择—将每个应用程序数据存储在单独的集合中,而IDF只基于特定的应用程序数据
如果这不适合您-您将需要编写自己的相似性,可能需要通过扩展和重写负责计算idf
我正在使用三个函数对es查询进行评分:
{
"query": {
"function_score": {
"query": {
"bool": {
...
}
}
}
},
"score_mode": "multiply",
"boost_mode": "replace",
"functions": [
{ f1 },
{ f2 },
{ f3 }
]
}
假设我们有一个给定的字符串
DataString DB 'AGIJKSZ', 0FFH ;
在it中找到J最有效的程序是什么?
我所说的时间效率是指最少的时钟滴答声
它是一个x86处理器,具有以下指令集:
MMX, SSE, SSE2, SSE3, SSSE3, SSE4.1, SSE4.2, EM64T, VT-x, AES, AVX, AVX2, FMA3, TSX
让我们假设字符串和搜索的字符都可以更改,但只能通过编辑代码来更改,并且我们总是在寻找单个字符。字符串是ASCII。字符串
我在netsuite搜索中遇到问题,我想从vendbill中获取税码,但无法访问。
我的过滤器包括['mainline','is','T',搜索列包括例如taxcode,但我无法获取此taxcode的值。NetSuite使用税码计算适用于销售交易(如销售订单和发票)的税率-它们不适用于供应商账单
此外,在销售订单和发票上,税码应用于项目子列表中的每个项目,因此设置过滤器['mainline','is','T']不会显示任何税码。我的意思是:['mainline','is','F']
标签: Search
search-engineinformation-retrievalprecision-recall
我目前正在开发一个小型的网络搜索引擎,但我不知道如何评估它。我知道搜索引擎可以通过其精确性和召回率来评估。在一个更“本地化”的信息检索系统中,例如电子图书馆,我可以计算它们,因为我可以知道哪些内容与我的查询相关。但是在一个基于网络的信息检索系统中,例如谷歌,不可能计算召回率,因为我不知道有多少网页是相关的。这意味着不能进行F-measure和其他需要相关页数的测量
我写的都对吗?网络搜索引擎评估是否仅限于精确性?有没有其他衡量标准可以用来评估网络搜索引擎(除了P@k)?正确的是,精确度和召回率以
Solr“qf”参数的工作原理如下:
score1 = winner1_score + tie_1 * loser1_score
score2 = winner2_score + tie_1 * loser2_score
final score = score1 + tie_2 * score2
假设我有:query=“sid”和qf=[field1,field1\u-edge,field2,field2\u-edge]
Solr分数计算如下:
score1 = winner1_score
规格:Solr 7.7.1。Ubuntu Linux 18.04
我一直在遵循本教程,只需创建一个solr核心,并从solr打包的films示例发布数据
我使用了命令
bin/post-c films example/films/films.xml并在第6个文档上收到以下错误
<str name="msg">ERROR: [doc=/en/quien_es_el_senor_lopez] Error adding field 'name'='¿Quién es el señor Ló
作为一个项目的一部分,我正在尝试在一个吃豆人游戏的上下文中实现一个*(参见加州大学伯克利分校吃豆人ai项目)。这里没有鬼魂或胶囊,只有迷宫和“水果”。然而,我很难理解启发式函数和代价函数之间的关系
根据该项目,在定义搜索问题时,我们需要指定一个步骤成本,该步骤成本源自:
score=-Nb步骤+10*nbofeatedendots+200*nbofeatedhosts+(-500*isLoss)+(500*isWin)
这个成本应该总是正的,因此,为了简单起见,我决定采用:1.5-(0.5*At
我正在使用alfresco 5.2.3 enterprise和solr6搜索服务。
当我在alfresco平台jar和alfresco共享jar中部署应用程序自定义代码时,一切正常。
现在,当我安装alfresco记录管理amp文件时,搜索停止工作。我甚至无法搜索单个文档或文件夹。
RM amp版本:alfresco-RM-enterprise-repo-2.7.0.amp和alfresco-RM-enterprise-share-2.7.0.amp
有三个不同的实例:repo(alfresco
我对gtfs文件格式的理解有问题。或者数据中可能有错误。有一份来自公共交通机构“Verkehrsverbund Mittelthüringen”(VMT)的gtfs文件。此数据可在以下位置访问:
例如:我用ID9782458()进行了这次旅行
它的服务ID45符合规范
45,0,0,0,0,0,0,0,20191101,20200229
此外,以下是
这是否意味着,除2019年11月1日至2020年2月29日之外,该服务始终可用?我现在的问题是搜索引擎的输出。它说,ID为9782458的旅行将
标签: Search
dropdownsemantic-uihidden-field
有没有一种方法可以从隐藏的文本中进行搜索?我想搜索不仅从下拉项文本,但另一个隐藏的文本内容以及。我知道语义搜索下拉列表通常也在数据值字段中搜索。但在我的例子中,数据值只是一个ID。我还想添加另一个字段进行搜索
在Tig中,按键进入搜索视图。但是如果我不小心按下了它,我该怎么退出呢
我尝试了ESC和退格,但没有结果
我对这件事作了一番评论
使用Ctrl+C退出搜索提示您也可以点击enter来运行搜索(无论搜索是否无效)。在恢复视图焦点时,您只需收到一条“您的搜索”未找到匹配项的消息,我测试了它,在搜索视图中,当我不输入任何内容,只需单击输入,它与“q”字符匹配!这不会发生在我身上。如果你点击backspace删除任何奇怪的字符(因此没有匹配的字符)?在搜索视图下,无论你是否点击backspace按钮,结
我正在尝试集成WHMCS中的几行代码,以便在输入字符串时搜索可用性的“域搜索栏”。这是用于域订购,允许潜在客户直接进入购物车并输入域。见下文:
<form action="https://sales.tgitmedia.co.za/cart.php?a=add&domain=register" method="post">
Find your Domain: <input type="text" name=&q
1 2 3 4 5 6 ...
下一页 最后一页 共 124 页