电子政务解决方案.ppt
电子政务解决方案2.ppt
基于全文检索的档案管理系统解决方案.ppt
企业网站和网上信息平台解决方案.ppt
全文检索光盘出版解决方案.ppt
光盘出版系统FAQ

1、什么是光盘出版系统
   光盘出版系统是一个全文检索光盘制作的工具软件,可以将用户的信息资源(例如报纸、期刊、图书、文件、资料库等)打包到光盘中(或其他介质也可),提供一个操作界面,让众多的用户能够查询、浏览、使用这些信息。
   传统出版物电子化后,如果仅仅以文件形式提供,将过于简单,不利于信息的有效的和充分的利用;如果以复杂的大型数据库系统提供,又不便于收藏、传送、使用等。光盘出版形式正好解决了这些问题。光盘出版系统以全文检索数据库为核心,能够管理、发布和检索海量的数据、文档和多媒体资料。它既能管理和检索数字、字符串、日期等结构化数据,又能存储、管理、显示文档、图片、影音等多媒体资料,对文档等非结构化数据还能提供全文检索;它能把信息包装成独立的产品,在别的机器环境或目录下照样正常使用,因而是便携式可移动的数据库。
   因此,它的作用是大型数据库或关系型都无法取代的。以光盘或其他便携式介质为载体发布法规信息,是web形式之外的另一个重要方式,有着不可替代的作用和优势。例如,在收费方面,采用易于成交的传统的交易方式;在数据保护方面,可以配合硬件来加密数据、防止盗版;在使用方面,方便携带、没有网络也可使用、即插即用等等。
   光盘出版系统 适用于报社、杂志社、出版社、图书馆、网站、信息中心、情报所、研究所、档案室等企事业单位、政府部门进行数据型、文档型、多媒体型光盘的制作,甚至个人也可以收集信息分类发布,也适用于企事业单位内部文档管理、信息的收集、分类和检索,以下是一些可能的应用:
   ※报纸、期刊合订本 / 精华本 / 数据库
   ※法律法规
   ※专利
   ※电子书库、书目、电子出版物
   ※企事业名录、客户信息
   ※产品目录
   ※档案资料
   ※国际国内标准
   ※网址库、网站页面打包
   ※论文、专业文献、专题资料、文件资料选编
   ※百科全书
   ※历史资料、地理资料、地方志
   ※科技 / 经济 / 商务 / 医学情报信息
   ※素材库
   ※人物年鉴

2、全能光盘出版系统的优势和特色
★ 全能光盘出版系统集成了数据管理、界面设计、光盘制作等全部功能。
★ 内嵌的TRS全文检索数据库市场占有率最大:检索类光盘最重要的是数据库引擎的选择。新科光盘出版系统选择TRS全文检索数据库作为核心。TRS全文检索数据库在同类产品中的市场占有率一直稳居第一,达到70%以上。
★ 稳定性:TRS的用户包括1000余家企业或政府部门,多数是基于互联网的大型应用;光盘出版系统内嵌的TRS全文检索数据库与TRS企业版是同一个核心,经过10余年来的不断升级发展,稳定性承受了各种不同环境的考验;
★ 查询速度:TRS的查询速度明显优于其它同类产品;特别是随着数据量的增加,这种优势更明显;根据测试,当记录数或数据量达到一定规模后,一般数据库的全文检索速度会呈指数级下降,而TRS不会;TRS通过高效索引、并行计算、缓冲(cache)技术等,真正做到了G级数据亚秒查询速度。考虑到光盘比硬盘的读取速度更低,只有一个检索速度快的引擎才能满足要求。
★ 数据压缩:TRS对入库原始数据和索引都可进行压缩,从而节省了宝贵的存储资源;TRS的数据膨胀率是0,即原始的数据入库建立索引后,平均不会增加存储量;
★ 数据和软件加密:TRS对入库原始数据可进行加密,其他人几乎不可能打开原始的数据库数据文件来分析和截取数据,从而达到数据保密的目的;TRS还提供一个口令机制,可对用户的数据加上一把锁,其他人通过TRS开发包也无法读取数据;系统可按硬件生成序列号,光盘用户只有取得合法的序列号才能正常检索。(如需用加密狗等硬件加密,加密狗由用户购买,我们提供开发)。提供PDF文件的加密解决方案。
★ 全方位的检索支持:按词/按字检索;多字段组合检索;与或非逻辑运算;渐近检索;段句位位置检索;词根检索;基于词典的概念检索(如同义词扩展检索、主题词扩展检索)等等;还支持各种排序方式;
★ WEB界面:web版的所有界面和window单机版的主要界面(检索界面和细览界面)采用html模版,允许用户进行任意设计界面和通过编写javascript控制功能,实现界面的个性化和功能的定制;提供多种不同的检索界面、检索方式、显示风格,无需编程即可实现;随着情况变化,用户需要调整或重新设计,也完全可以方便迅速地实现, 降低了开发成本;因此,新科光盘出版系统具有非常大的灵活性和可扩展性;web界面可以放置大量的图片使界面更美观、友好, 象网站一样丰富多彩;还可以放一些动画广告增加光盘的作用;操作与上网操作完全一样,无需培训,一看就会;web界面还支持检索词直接拖放到检索框,减少了用户输入工作量。总之,web界面的好处非常多,也是目前光盘出版的最新趋势和最新技术,能够支持单机版web界面的产品非常少,同时提供单机版web界面和网络版web界面并使二者的设计和使用完全相同的产品就更少了。
★ 提供单机WEB版和局域网WEB版:webd单机版和网络版计过程完全一致,无需双重设计;提供单机版后,一旦有需要,可以迅速提供相同界面的网络版;其设计思想和实现方法与著名的TRS WAS信息发布系统一脉相承;网络版支持多人同时通过浏览器访问;
★ 使用更简单:制作的光盘可以安装,也可以提供免安装版本,实现了插入光盘立即开始检索;单机版和网络版可运行于所有win32操作系统;可支持收藏夹、书签等功能;
★ 显示更完美:提供各种显示风格,例如可控制标题、作者等的字体、颜色、位置等;命中词的显示和跳转也极富特色;
★ PDF/HTML/OFFICE/IMAGE等格式的支持:支持各种主流格式的索引、检索、显示、命中词反显等等。在PDF的加密、检索、命中词反显和HTML的检索、反显及OFFICE文件批量处理为PDF/HTML以便于发布方面,有良好的技术支持和成功经验;
★ 绿色软件:除了标准的IE浏览器,整个程序不依赖于其它任何组件,因此可靠性很高;
★ 可与 TRS 企业版协同工作:直接导入数据,直接使用TRS 企业版的导航和模板;

3、 TRS全文检索引擎

我们使用的TRS个人版检索引擎来自于TRS内容服务器企业版,保留了企业版文档数据库管理、索引、检索、中文信息处理(如分词)等全部必要的强大功能和特色,二者源代码完全一致,同步升级,经过了数百家大型企业、政府部门、网站在windows、unix、linux等不同平台上的考验;同时又针对光盘产品的特点进行了精简(如去掉用户管理等企业版特征)、优化和增强(如压缩、加密和口令保护等)。

领先的中文自然语言处理技术:
中文按词索引技术及按字索引的BI-GRAM技术极大地提高了查准率和检索速度;基于中文语言辞典的智能检索以及中文自动分类和自动摘要;存储需求最低的全文检索系统 -- 通过独特的压缩技术使空间膨胀率保持在-0.1至0.2;

高效检索算法保证性能
   采用"线程并行计算"、"索引分区"、关键字CACHE、LIFO快速排序等技术使海量中文内容的查询时间为亚秒级;检索性能见下表,测试环境:Intel PIII-550MHz/256M RAM/7200RPM HD/Linux2.2 ;测试数据:52年人民日报(1947-1998)/约110万篇文章/10亿汉字(2.1GB)

编号

检索表达式

排序方式

命中率/词频

响应时间(秒)

1

老舍 相关排序 1173/2459

0.1

2

环境保护 相关排序 3998/8036

0.6

3

计算机+电脑 相关排序 12293/30271

0.1

4

农业学大寨 相关排序 5968/11947

2.2

5

毛泽东*尼克松 相关排序 470/2751

0.6

6

石油开采 相关排序 449/551

0.3

7

计算机*网络 相关排序 829/4795

0.2

8

体制pre/2改革 相关排序 12670/23604

0.9

9 日期=1966to1976*邓小平 相关排序 2803/14901 0.9

全方位的数据管理:
支持英文、中文GB2312、GBK、BIG5、Unicode各种编码;支持各种字处理、图形、音像等多媒体数据的存储和查询,真正的海量结构(数据规模仅受机器字长的限制):

项目

性能指标

最大数据库(视图)数

几十亿

最大记录数/数据库

42亿条(即2 32 条, 对于64位机器则为2 64 条)

最大记录长度

256MB

最大字段数/数据库

1023

最大字段长度

16MB

最大数据库数

64

同时检索数据库数

50

支持的字符集

GB2312,GBK,BIG5,ASCII,Unicode

6种字段类型

DATE(日期), NUMBER(数值) CHAR(字符串),PHRASE(短语),DOCUMENT(全文) BIT(多媒体)

数据加载速度

300MB/小时(测试环境为PII400/128MRAM/Windows NT4.0)

 
  4、光盘制作流程
*建立和设计数据库结构;
*收集、整理、规范数据,使数据符合TRS格式和上述库结构;
*将数据导入到数据库中;
*如果是WEB版,需要设计频道、导航树、概览模版、细览模版、检索模版及其他显示界面;
*设置有关选项;
*发布光盘;
*测试直到通过后刻盘;


5、重要提示:
web单机版使用到的框架页面(包括FRAMSET和IFRAME)中,如果使用tree或search等TRS命令作为窗口的URL,注意要用间接的办法。例如,应避免使用:<frame src="trsbro://tree">,而使用:<frame src="gototree.htm">,另外在gototree.htm中再使用:
<html>
<head>
<meta http-equiv="Content-Type" content="text/html; charset=gb2312">
<SCRIPT LANGUAGE=javascript>
function onbodyload()
{
document.location.href="trsbro://tree ";
}
</SCRIPT>
</head>
<body onload="onbodyload();">
</body>
</html>


6、启动对话框如何定制
在光盘信息发布时,安装类型有多种供选择;如果选择自定义类型,则生成的光盘自动播放(或运行根目录下的autorun.exe)时显示启动对话框;缺省的对话框中包含安装、运行、退出等链接,供最终用户选择。启动对话框的外观和内容都可以定制。disk1目录下的autorun.ini文件(如果没有可以创建一个),格式如下:
[option]
rectsize=0,0,800,600
border=0
其中,border=1或0分别表示启动对话框是否显示边框;rectsize后面的数字中,后面两个数字分别表示启动对话框的宽度和高度。disk1目录下的autorun.htm文件就是启动对话框显示的内容;制作者可以按超文本格式任意编辑该文件,例如显示特定的产品信息、图标等;但是有三个特殊的超文本链接注意运用:
运行链接:trspc://shell?op=open&file=trshome\bin\trscd.exe&dir=trshome\bin&exit=1
安装链接:trspc://shell?op=open&file=setup.exe&exit=1
退出链接:trspc://exit
exit参数为1或0分别表示激活链接后,是否关闭启动对话框。
技巧:如果不想显示滚动条,只要注意body的用法就可以了,例如:
<body style="border:0;overflow-x:hidden;overflow-y:hidden”>
如果需要调用其它程序,可以模仿上面的运行和安装链接,主要是file参数表示要运行的程序,dir表示该程序工作目录,这里的路径都是从disk1出发开始计算的。
如果完全需要自行编制启动对话框,请修改autorun.inf,将其中的open=autorun.exe改成自己的程序名字,如:open=myxxx.exe



7、升级程序或补丁文件应如何拷贝
升级程序或补丁文件一般应复制到光盘出版系统的安装目录的相应子目录下,例如bin、web、doc、disk1等子目录;一般会通知具体放到哪个子目录,如果没有指定子目录,则可以到这些子目录下寻找和升级文件相同文件名从而确定子目录。对于已发布的光盘,也可以按上述方法直接升级。此时要注意的是,如果是web单机版升级,则需将trsbro.exe文件名(如果在升级包中)改为trscd.exe;如果是web网络版升级,则需将trssvr.exe文件名(如果在升级包中)改为trscd.exe。



8、如何提供片头片尾
片头、片尾仅对单机版有作用;片头、片尾文件分别为doc目录下的cdstart.htm和cdend.htm;如果使用avi格式的片头、片尾,则文件名分别cdstart.avi和cdend. avi;如果不存在片头、片尾,将不会播放,如果存在,则程序运行时首先显示片头,退出时显示片尾,并且都是全屏显示。片头、片尾文件的内容可由用户自行定制。一般推荐片头、片尾各包含一个flash,因为程序自动支持flash播放和avi播放。如果使用其它格式例如mpeg格式等,则需要自行确定使用的控件和确保该控件的安装。
片头、片尾的结束有可以有两种情况。一是任何时候通过鼠标或键盘点击就自动结束播放;二是播放结束后,flash或html可以自动导航到“trspc://enter”这个新的URL,将导致结束播放。如果不满足上面两种情况,播放结束后将静止在最后一个画面等待点击结束。至于avi格式,无法自动导航到其他URL,播放结束后无需点击,自动进入主程序。Htm中包含flash的代码例子如下:
<html>
<head>
<meta http-equiv="Content-Type" content="text/html; charset=gb2312">
<style>BODY {border:0px;overflow-x:hidden;overflow-y:hidden}</style>
</head>
<body bgcolor="##003CAD" text="#000000" topmargin="0" leftmargin="0">
<div align="center">
<center>
<table width="100%" border="0" cellspacing="0" cellpadding="0" height="100%"
style="border-collapse: collapse">
<tr>
<td width="100%" height="100%">
<object classid="clsid:D27CDB6E-AE6D-11cf-96B8-444553540000" width="100%" height="100%">
<param name="movie" value="start.swf">
<param name="quality" value="High">
<param name="Scale" value="ExactFit">
<param name="Src" value="start.swf">
<param name="SAlign" value="3">
<embed src="start.swf" quality="high" type="application/x-shockwave-flash" width="778" height="425">
</embed></object>
</td>
</tr>
</table>
</center>
</div>
</body>
</html>
 
 
 

版权所有北京新锐科丁信息技术有限公司
地址: 北京市海淀区上地信息产业基地尚品公寓1109(上地佳园23号楼)  
联系电话: 010-62971186,传真:62979435

网址:http://www.newcoding.com.cn  
邮箱:newcoding@vip.sina.com
开户行:工行东升路分理处
帐号:0200006209005539544