Tag: 搜索
使用 Sphinx 更好地进行 MySQL 搜索
nick | mysql | 2012-02-08
使用 Sphinx 进行非全文本搜索
Federico Kereki, 系统工程师, 自由职业者
简介: 尽管 MySQL 是一个出色的通用数据库,但是如果您的应用程序需要进行大量搜索,那么使用 Sphinx 可获得更好的性能。尽管 Sphinx 是一种全文本搜索工具,但即使与非全文本查询一起使用,它仍然可以提高应用程序的速度。本文将介绍如何针对此任务配置 Sphinx,其中包括... [阅读全文]
Sphinx 2.0.3 发布,全文搜索引擎
全文搜索引擎 Sphinx 发布了最新的 2.0.3 版本,可从这里下载。
这是自 0.9.9 版本以来的第一个稳定发行版本,包括稳定的经过大量测试的实时索引技术,64位的 MVA 支持,基于表达式的ranker、关键字字典等多项新特性,完整列表请看 changelog.
Sphinx是一个基于SQL的全文检索引擎,可以结合MySQL,PostgreSQL做全文搜索,它可以提供比数据库本身更专业的... [阅读全文]
迅搜全文搜索引擎 XunSearch
迅搜(xunsearch)是采用 C/C++ 基于 xapian 和 scws 开发的全文搜索引擎解决方案,提供 PHP 语言的开发接口。支持海量数据高速检索,功能强大,简单易用!
本项目旨在帮助一般开发者针对既有的海量数据,快速而方便地建立自己的全文搜索引擎。全文检索可以帮助您降低服务器搜索负荷、极大程度的提高搜索速度和用户体验。
**高性能**
后端是采用 C/C++ ... [阅读全文]
搜索提示服务引擎 sgserver
nick | open | 2011-09-07
Suggestion Server Based Real-time
其实是个suggestion的搜索引擎,能很轻松的提供搜索提示服务,不同与传统的搜索提示服务在于 sgserver处理的目标数据是各个不同并实时变化的,比如用于 sns好友搜索,提供所有好友的名称,可通过全拼、简拼的前缀,局部字母等方式进行匹配,
优势:
适用于关系型的数据检索(即每个查询的搜索范围不同,关系又在实时变化... [阅读全文]
VisualSearch.js 超级搜索框
VisualSearch.js 正确了搜索框,增加了查询关键字的自动完成功能。
授权协议: 未知
开发语言: JavaScript
操作系统: 跨平台
收录时间: 2011年07月01日
软件首页 软件文档 软件下载
[阅读全文]
image-r3 基于内容的图片搜索引擎
随着互联网技术向宽带、高速、多媒体方向的发展,人类正快速进入一个信息化的时代。各种信息工具、技术、载体等应运而生。在众多 类型的信息资源中,图像具有直观、形象、易于理解和信息量大等特点,成为资源库的重要组成部分。同网络信息一样,由于图像数量巨大,种类繁多,加之排列方 式错综复杂,这给图像检索带来了困难。近年来,基于内容的图像检... [阅读全文]
哼唱搜索——FMS尝试之路
百度mp3近期活动频繁,各种尝试各种高端。其中的哼唱搜索,算是一次比较新的尝试了:http://mp3.baidu.com
哼唱搜索的目标是能让用户简单哼哼一段歌曲旋律即可搜索到相对应的歌曲。其最核心的包括两部分,一部分是语音分析,另一部分就是语音录制。这里就简单分享下语音录制这一部分。
关于音频录制,之前有过调研。在Flashplayer10.1中,可以直接获取... [阅读全文]
lucene 分布式运行框架 Nut 1.0a4 测试实例
nick | java | 2010-08-02
项目地址:http://code.google.com/p/nutla/
1、从 http://www.mongodb.org/display/DOCS/Downloads 下载mongodb windows版本。创建目录 d:\db,解压下载的mongodb,在其bin目录
下运行启动命令:Mongod.exe –dbpath=d:\db
2、从 http://code.google.com/p/nutla/downloads/list 下载 nuttest.war ,放在tomcat6下的webapps目录下
3、http://127.0.... [阅读全文]
google搜索排名将加入”网站速度” 因素
前几天,google官方blog发布1篇小文章,该文章指出将把 “网站的访问速度” 加入搜索排名算法中,说明以后网站越快,在google中的排名就越有可能靠前。
该文章地址:http://googlewebmastercentral.blogspot.com/2010/04/using-site-speed-in-web-search-ranking.html
因该blog好像在国内访问不了(不知道是否和谐了),所以把部分内容帖出来:
... [阅读全文]
RDBMS的lucene爬虫
主要介绍如何周期性尽量实时地从RDBMS爬数据然后建索引,不涉及AOP或ORM Framework的listener方式。
先决条件:
1. Lucene索引是从无到有的,一开始所有数据都是存储在RDBMS(Oracle)中。
2. 数据表有一列是updateTime或称为lastModifiedTime用来存储最后一次更新时间,并建有db索引
3. 主表必须要有主键,这个主键也用来唯一确定一个Lucene ... [阅读全文]