12/28/2009 
Kansas Information Technology Architecture 
Page 4-93 
Version 11.2 
Digital document metadata: The search service standard should have a history of production 
use for searching metadata variants. 
Collection organization:  In addition to organizing content within a searchable collection, 
designers of search facilities are often faced with compiling information as a logical collection. 
The search service standard itself should not standardize on any particular approach, but should 
be compatible with many and diverse approaches to compiling collections of information 
Service registries:  A gateway approach would allow the search service standard to 
interoperate with business and services registries using either the ebXML model or the 
Universal Description, Discovery, and Integration (UDDI) model. This approach would likely 
parallel the approach for interoperable searching of any registry supporting the ISO 11179 
"meta-model" guidelines. These are of particular interest from an infrastructure architecture 
perspective in that such registries can also hold the key semantic concepts that are essential to 
further evolution of the search service standard itself. As new communities of practice converge 
on interoperable searching using their key semantic concepts, these can be placed into a 
searchable semantic registry. 
Scalability: Optimization of any particular implementation should not be constrained by the 
service itself.  A separate issue is the degree to which the standard search service may be 
operated in parallel against many resources.  The standard search service should also be 
scalable in terms of supporting arbitrarily complex searches. 
Extensibility: The search service standard should be adaptable to virtually all search tasks. In 
addition to the usual sets of data structures and relations, other structure and relation semantics 
should be definable through profiles. 
Internationalization: The search service standard must have be in use worldwide in many 
languages. It should support negotiation between client and server as to each other's language 
capabilities for the session. Character set negotiation should also be supported, with support for 
Latin-1 as a minimum for U.S. Federal Government applications.”  
From: Categorization of Government Information (CGI) Working Group, U.S. Federal Interagency 
Committee on Government Information, December 2004 
http://www.search.gov/interop/requirements.html
Additional Requirements include:
 Supports different levels of access control, such as restrictions by service, session, 
distributed resource, database, record, or data element  
 Supports authentication of user identity through an ancillary service (e.g., e-Authentication)  
 Supports verification of the integrity of delivered data, metadata, or other information  
 Supports the search service standard for library catalogs accessible over network 
technologies (ISO 23950, identical to ANSI/NISO Z39.50)  
 Supports the library standard for catalog records, Machine-Readable Cataloging   
 Supports access to data without mandating proprietary technologies, nor proprietary 
vocabularies or thesauri   
 Can be readily accommodated by leading search products, including Internet search engines  
 Supports search of information that may be unstructured (often called "full-text"), 
semi-structured (typically represented with inline "markup"), or structured (sometimes known 
as "fielded")  
 Supports search of HTML meta element contents and other varieties of metadata embedded 
within particular types of files (e.g., PDF, e-mail, etc)  
 Supports customizable search of other varieties of structured metadata through common 
mechanisms such as SQL and LDAP  
 Provides for interoperable search across locators for information and collections 
of information  
 Interoperable with the international standard search service supporting the U.S. National 
Spatial Data Infrastructure Clearinghouse of geospatial data  
.Net merge pdf files - Merge, append PDF files in C#.net, ASP.NET, MVC, Ajax, WinForms, WPF
Provide C# Demo Codes for Merging and Appending PDF Document
add multiple pdf files into one online; attach pdf to mail merge in word
.Net merge pdf files - VB.NET PDF File Merge Library: Merge, append PDF files in vb.net, ASP.NET, MVC, Ajax, WinForms, WPF
VB.NET Guide and Sample Codes to Merge PDF Documents in .NET Project
add pdf together; pdf merger online
12/28/2009 
Kansas Information Technology Architecture 
Page 4-94 
Version 11.2 
 Implementable over the Internet using TCP/IP, HTTP/HTTPS, data query structures such as 
HTTP GET and HTTP POST, and XQUERY 
 Precisely defined as to how searches are expressed and communicated between a client 
component and a server component, including a query language, a query syntax, and 
standardization of a result set schema   
 Specified in an interface definition language such as Web Services Definition Language 
(WSDL)  
 Supports searching of structured information using a nested Boolean query, e.g., (date > 
'20040101') AND ((subject = 'earthquake') OR (subject = 'temblor'))   
 Supports the usual sets of data structures (word, phrase, date, URL.) and relations (equal, 
greater than, less than)  
 Includes a query evaluation function to handle "abstract concepts" (e.g., name, category, 
date) according to what they mean semantically rather than merely how they may be labeled 
syntactically  
 Supports abstract concepts that are produced by semantic mapping without requiring any 
particular semantic mapping technique  
 Supports gateway to Internet Anonymous FTP Archive (IAFA) file system catalogs and 
Distributed Authoring and Versioning for the Web (WebDAV)   
 Adopts readily to the underlying data model of named properties and property sets that is 
defined for objects addressable by software  
 Already in production use for searching metadata variants such as Dublin Core Metadata 
Initiative, ISO 15836 Encoded Archival Description, and ISO 8879Standard Generalized 
Markup Language (SGML)  
 Compatible with many and diverse approaches to compiling collections of information, 
without mandating any particular approach  
 Supports interoperable search of business and services registries, modeled on ISO 11179 
Metadata Registries, ebXML, or the Universal Description, Discovery, and Integration (UDDI) 
model  
 Scalable in terms of supporting arbitrarily complex searches   
 Scalable in not foreclosing concurrent searches on multiple servers   
 Extensible to search tasks with unusual data structures and relations, definable 
through profiles or equivalent  
 Provides extension mechanisms to nurture innovation in areas not yet ready for the broadest 
level of standardization  
 Has been in use worldwide in many languages  
 Supports negotiation between client and server as to each other's language capabilities for 
the session  
 Supports character set negotiation, with Latin-1 as a minimum for U.S. Federal Government 
applications 
From: Recommendations On The Categorization Of Government Information 
December 16, 2004, http://www.search.gov/interop/Recommendations-CGI-final.doc
Online Merge PDF files. Best free online merge PDF tool.
Thus, C#.NET PDF document merge library control can be counted as an efficient .NET doc solution for keeping PDF document files organized. Download Free Trial.
merge pdf; split pdf into multiple files
VB.NET PDF Convert to HTML SDK: Convert PDF to html files in vb.
Converted HTML files preserve all the contents of source PDF file, like font style and anchors, in VB.NET class application. And
append pdf files reader; append pdf
12/28/2009 
Kansas Information Technology Architecture 
Page 4-95 
Version 11.2 
15.3.1 Query 
Support retrieval of records that satisfy specific query selection criteria 
Definitions for Query include: 
 Query: To interrogate a collection of data such as records in a database. The term may also be 
used to search a single file or collection of files such as HTML files on the Web. However, in 
addition to obtaining lists of records that match the search criteria, queries to a database allow for 
counting items and summing amounts. A query on the Web yields only a list of matching pages 
and is more often called a "search."  [Computer Desktop Encyclopedia
. Computer Language 
Company Inc., 2006. Answers.com 19 Jul. 2006. http://www.answers.com/topic/query
 A statement of information needs, typically keywords combined with Boolean operators and other 
modifiers, in the field of information retrieval.  
 A database query, which is a specification of a result to be calculated from a database. Queries 
are often specified using SQL. Other examples are the CODASYL database language, "network" 
databases, relational algebra, relational calculus, Datalog, SQL3, QUEL, XPointer, XPath and 
OQL. 
 A request for information from a database. There are three general methods for posing queries:  
 Choosing parameters from a menu: In this method, the database system presents a list of 
parameters from which you can choose. This is perhaps the easiest way to pose a query 
because the menus
guide you, but it is also the least flexible.  
 Query by example (QBE): In this method, the system presents a blank record and lets you 
specify the fields and values that define the query.  
 Query language: Many database
systems
require you to make requests for information in the 
form of a stylized query that must be written in a special query language. This is the most 
complex method because it forces you to learn a specialized language, but it is also the most 
powerful.  
[http://www.webopedia.com/TERM/Q/query.html
 Intelligent Content Services (ICS): uses linguistic analysis, fact extraction, automated 
categorization, and taxonomies to help organize and make sense out of large volumes of 
disorganized, unstructured content. 
Architecture 
Component 
Twilight 
Standard 
Current Standard
Emerging 
Standard 
Target
Query 
Single Word 
Keyword 
Keyword with 
Boolean and 
proximity operators 
Fielded Search 
Phrase search 
String Search 
Fuzzy Match 
Intelligent Content 
Services 
Intelligent Content 
Services 
Keyword with 
Boolean and 
proximity operators 
Fielded Search 
Phrase Search 
Fuzzy Match 
Query 
Language 
SQL 
XPointer 
XPath  
OQL 
XQuery 
SQL 
XPointer 
XPath  
OQL  
XQuery 
VB.NET PDF File Split Library: Split, seperate PDF into multiple
This is an VB.NET example of splitting a PDF to two new PDF files. You can use the following VB.NET demo to split PDF document to four files.
build pdf from multiple files; apple merge pdf
C# PDF Convert to SVG SDK: Convert PDF to SVG files in C#.net, ASP
file using C#. Instantly convert all PDF document pages to SVG image files in C#.NET class application. Perform high-fidelity PDF
combine pdf; pdf merge
12/28/2009 
Kansas Information Technology Architecture 
Page 4-96 
Version 11.2 
 Intelligent Content Services (ICS): a semantically smart content-centric set of software services 
that enhance the relationship between information workers and computing systems by making 
sense of content, recognizing context, and understanding the end user’s requests for information. 
Other Important information for Query  
 Resource: Brown, Matt and Laura Ramos “Searching For A Better Search,” Forrester Research 
Inc., August 29, 2005, 7 pgs. 
 Basic search focuses on word count and proximity instead of meaning, and errs on the side of 
recall over precision. 
 ICS accomplishes four main goals: 
 Imposes structure on a body of content 
 Discovers the inherent structure with documents or text 
 Exposes meaning to aid discovery and enable more relevant retrieval 
 Monitors content as it arrives and alerts users to interesting matches. 
15.3.2 Precision / Recall Ranking 
Support selection and retrieval of records ranked to optimize precision against recall 
Criteria for Precision / Recall Ranking 
 Relevancy should consider placement of words when applying weighting - in the document, 
filename or metadata.  A word appearing for the first time at the end of a document should not 
receive the same weight as a word in the filename or metadata. 
 Relevancy should consider file source, i.e. e-mail, file system, website 
 Relevancy should be accurate across file formats, i.e. Text, image, audio, video.  Non-text 
formats may be “mapped” or use metadata.   
 All results of a query should be relevant 
 All relevant results of a query should be returned so no important material is left out. 
Definitions for Precision / Recall Ranking include: 
 Precision Ranking -  # relevant hits in hit-list / # hits in hit-list.   
Precision is a measure of how well the engine performs in not returning non-relevent documents.   
 Recall Ranking -  # of relevant hits / # of relevant items in the collection   
Recall is a measure of how well the engine performs in finding relevant documents.  Recall is 
100% when every relevant document is retrieved.  Ranking is the art of sorting results in 
relevance to the submitted query. 
Architecture 
Component 
Twilight 
Standard 
Current Standard
Emerging 
Standard 
Target
Precision/ 
Recall 
Ranking 
Boolean operators 
within query to 
better define 
search criteria 
Natural Language 
query using 
Linguistic Analysis 
Bayesian 
Probabilistic Model 
Boolean operators 
within query to 
better define 
search criteria 
Natural Language 
query using 
Linguistic Analysis 
Bayesian 
Probabilistic Model 
VB.NET PDF- HTML5 PDF Viewer for VB.NET Project
VB.NET convert PDF to Word, VB.NET extract text from PDF, VB.NET convert PDF to Jpeg, VB.NET compress PDF, VB.NET print PDF, VB.NET merge PDF files, VB.NET
add two pdf files together; how to combine pdf files
VB.NET Create PDF from Word Library to convert docx, doc to PDF in
VB.NET convert PDF to Word, VB.NET extract text from PDF, VB.NET convert PDF to Jpeg, VB.NET compress PDF, VB.NET print PDF, VB.NET merge PDF files, VB.NET
pdf combine; pdf merge documents
12/28/2009 
Kansas Information Technology Architecture 
Page 4-97 
Version 11.2 
 Linguistic Analysis – Break down text to determine accurate concepts and meanings.  Allows 
search engine to overcome ambiguities in the user's search terms to increase search precision 
and recall rankings. 
 Parts of Speech Ambiguity – Words can be used with different meanings in a sentence.  
“How to set a table.”  “How to set the sets of a table.” 
 Topical Ambiguity – A word can have multiple meanings.  i.e. Report.  Can be a document, 
sound of a rifle being fired, or as a verb “to report on the topic”.   
 Bayesian Probabilistic Model  The likelihood that something will happen can be plausibly 
estimated by how often it occurred in the past.  An example is Google anticipating your search 
criteria “Did you mean...” by caching your previous searches and using that data to predict what 
you're looking for now to provide a more relevant results list. 
 For any given retrieved set, Recall is the number of retrieved relevant items as a proportion of all 
Relevant items. Recall is, therefore, a measure of effectiveness in retrieving (or selecting) 
performance and can be viewed as a measure of effectiveness in including relevant items in the 
retrieved set. 
 For any given retrieved set, Precision is the number of retrieved Relevant items as a proportion 
of the number of retrieved items. Precision is, therefore, a measure of purity in retrieval 
performance, a measure of effectiveness in excluding non-relevant items from the retrieved set 
Buckland, Michael and Fredric Gey, "The relationship between Recall and Precision",  
Journal of the American Society for Information Science
, 45(1):12-19, 1994. 
DOI: 10.1002/(SICI)1097-4571(199401)45:1<12::AID-ASI2>3.0.CO;2-LUS: 
http://dx.doi.org/10.1002/(SICI)1097-4571(199401)45:1<12::AID-ASI2>3.0.CO;2-L
Other Important information for Precision / Recall Ranking 
 
Organizations should determine the acceptable parameters for Precision and Recall Rankings 
within their system to determine the system requirements.  These parameters are measurable 
and testable using the formulas in the definitions
15.3.3 Classification 
Support selection and retrieval of records organized by shared characteristics in content or context 
Architecture 
Component 
Twilight 
Standard 
Current Standard
Emerging 
Standard 
Target
Classification 
schemes 
Examples of “traditional” 
schemes include: 
o Dewey Decimal 
System (DDC) 
o Universal Decimal 
Classification 
(UDC) 
o Library of Congress 
Classification 
System (LCC) 
Subject-specific 
schemes such as: 
o NLM (National 
Library of Medicine) 
o Engineering 
Information (Ei) 
Classification 
Codes 
o Mathematics 
Semantic web 
Dewey Decimal 
System (DDC) 
Universal Decimal 
Classification 
(UDC) 
Library of Congress 
Classification 
System (LCC) 
Subject-specific 
schemes such as: 
o NLM 
(National 
Library of 
Medicine) 
o Engineering 
Information 
(Ei) 
VB.NET PDF Convert to SVG SDK: Convert PDF to SVG files in vb.net
PDF; Merge PDF Files; Split PDF Document; Remove Password from PDF; Change PDF Permission Settings. FREE TRIAL: HOW TO: XDoc.HTML5 Viewer for C#▶: C# ASP.NET:
add pdf files together reader; pdf combine two pages into one
C# PDF Convert to Text SDK: Convert PDF to txt files in C#.net
content of target PDF document can be copied and pasted to .txt files by keeping original layout. C#.NET class source code for converting each PDF document page
asp.net merge pdf files; batch combine pdf
12/28/2009 
Kansas Information Technology Architecture 
Page 4-98 
Version 11.2 
Definitions for Classification include: 
 Data can be classified from a variety of perspectives.  Three primary perspectives are: 
o Information Lifecycle Management (Refer to the Back Office Services Domain, Data 
Management section for further information.) 
o Security (Refer to the Back Office Services Domain, Data Management section for further 
information.) 
o Subject / Topic 
 Classification systems provide ways to separate concepts into relatively broad topics. Many 
classification systems also include specific terminology to be used (for example, object names).  
Each item has a "correct" (or, at least, agreed upon) place somewhere in a single, large, 
hierarchically organized classification system. 
 Faceted Classification:  “A faceted classification differs from a traditional one in that it does not 
assign fixed slots to subjects in sequence, but uses clearly defined, mutually exclusive, and 
collectively exhaustive aspects, properties, or characteristics of a class or specific subject. Such 
aspects, properties, or characteristics are called facets of a class or subject […]”. 
 “[I]ndividual facets can be accessed and retrieved either alone or in any desired combination. 
This feature is especially important for computerized retrieval, which has been successfully 
applied to faceted classification, and in online retrieval as a complement to verbal retrieval by 
subject headings or keywords.” 
 “Since the 1960s, all major classification schemes (with the exception of LCC) either have been 
partially restructured on a faceted basis or display a fully faceted structure.” 
Wynar, Bohdan S. Introduction to cataloging and classification. 8th edition. 1999. pgs. 320, 322 
 The facet classification is an analytic-synthetic scheme. It is analytic because it subdivides 
broader elements into single concepts that are clearly defined through facet analysis. It is 
synthetic in that new elements can be developed. 
Other Important information for Classification  
 In order for the categorization of Government information to add value for the information user, it 
should meet several general major requirements:   
 Enhance public access to Government information resources.   
 Render a predictable level of granularity among the search returns from decentralized data 
sources.   
 Be a realistic mandate for Government entities, many of which operate with less than optimal 
levels of funding or IT support, to carry out.   
 Be compatible with existing information characterization and retrieval mechanisms. 
 Be flexible enough to allow for technological advances in information management, 
publishing, or discovery and retrieval.  
From: Recommendations On The Categorization Of Government Information 
Subject 
Classification 
o ACM Computing 
Classification 
System (CCS) 
Classification 
Codes 
o Mathematics 
Subject 
Classification 
o ACM 
Computing 
Classification 
System 
(CCS) 
Faceted 
Classification 
Subject Domain specific 
standards 
Subject Domain 
specific standards 
12/28/2009 
Kansas Information Technology Architecture 
Page 4-99 
Version 11.2 
December 16, 2004, http://www.search.gov/interop/Recommendations-CGI-final.doc
 A faceted classification system has the following important characteristics: 
 A faceted system focuses on the important, essential or persistent characteristics of content 
objects, helping it to be useful for fine-grained rapidly changing repositories. 
 You don't have to know the name of the category (or categories) into which a document is 
placed. In a business world in which terminology changes faster than you can blink, this is a 
big asset. 
 The absence of polyhierarchy is implied, at least, by having mutually orthogonal facet 
hierarchies. The ordering principle in a facet is not necessarily hierarchical (general-specific, 
whole-part, etc.), although that will be true in most cases. It might even be alphabetical.  
 It's easy to add a new facet at any time.  
 Flexibility in general. Makes few assumptions about the scope and organization of the 
domain. So it's hard to "break" a faceted classification schema.  
 Should be easier to construct the facet hierarchies.  
 Combining elements from separate facets using a defined syntax -- for example, to express 
the functions of a product, make assertions, or frame questions in a structured way -- is an 
extremely powerful method of precise retrieval.  
 Adding persistent (even "typed") relationships between elements in different facets -- for 
example, John Smith (in the Person facet) <relationship: is an employee of> Generic 
Company (Organization facet) provides substantial useful representation of knowledge in the 
faceted classification schema itself. 
The Knowledge Management Connection 
http://www.kmconnection.com/DOC100100.htm
15.3.4 Pattern Matching 
Support retrieval of records generated from a data source by imputing characteristics based on patterns 
in the content or context 
Definitions for Pattern Matching include
 Pattern matching is the act of checking for the presence of the constituents of a given pattern. In 
contrast to pattern recognition
, the pattern is rigidly specified. Such a pattern concerns 
conventionally either sequences or tree structures. Pattern matching is used to check that things 
have the desired structure, to find relevant structure, to retrieve the aligning parts, and to 
substitute the matching part with something else.  Pattern matching includes testing whether an 
input sentence or structure matches a pattern that may contain variables, such as the use of 
wildcards * and ? as part of a filename specification, to select multiple files with similar names.. 
Pattern matching is followed by substitution into an output pattern to transform expressions.  
Substitution is the replacement of variables in an expression or pattern by values of the variables. 
Other Important information for Pattern Matching  
 Sequence (or specifically text string) patterns are often described using regular expressions 
and matched using respective algorithms. Sequences can also be seen as trees branching for 
Architecture 
Component 
Twilight 
Standard 
Current Standard
Emerging 
Standard 
Target
Sequence 
Patterns 
Exact string match 
Substitutions 
Wildcards 
Exact string match 
Substitutions 
Wildcards 
Tree 
Patterns 
Structured 
Programming 
Neural Networks 
Structured 
Programming 
Neural Networks 
12/28/2009 
Kansas Information Technology Architecture 
Page 4-100 
Version 11.2 
each element into the respective element and the rest of the sequence, or as trees that 
immediately branch into all elements. 
 Tree patterns can be used in programming languages as a general tool to process data based 
on its structure. Some functional programming languages such as Haskell, ML and the symbolic 
mathematics language Mathematica have a special syntax for expressing tree patterns and a 
language construct for conditional execution and value retrieval based on it. Because of simplicity 
and efficiency reasons these tree patterns lack some features that are available in regular 
expressions. Depending on the languages, pattern matching can be used for function arguments, 
in case expressions, whenever new variables are bound, or in very limited situations such as only 
for sequences in assignment in Python. Often it is possible to give alternative patterns that are 
tried one by one. Pattern matching can benefit from guards. 
 
Pattern recognition is a field within the area of machine learning. Alternatively, it can be defined 
as "the act of taking in raw data and taking an action based on the category of the data" 
(CITATION).  As such, it is a collection of methods for supervised learning. Pattern recognition 
aims to classify data (patterns) based on either a priori knowledge or on statistical information 
extracted from the patterns. The patterns to be classified are usually groups of measurements or 
observations, defining points in an appropriate multidimensional space. A complete pattern 
recognition system consists of a sensor that gathers the observations to be classified or 
described; a feature extraction mechanism that computes numeric or symbolic information from 
the observations; and a classification or description scheme that does the actual job of classifying 
or describing observations, relying on the extracted features.
12/28/2009 
Kansas Information Technology Architecture 
Page 4-101 
Version 11.2 
15.4. Communication 
Capabilities within this Service Type transmit data, messages and information in multiple formats and 
protocols. 
15.4.1 Real Time Chat / Instant Messaging 
Support the conferencing capability between two or more users on a local area network or the internet 
15.4.2 Audio Conferencing 
Support audio communications sessions among people who are geographically dispersed 
15.4.3 Video Conferencing 
Support video communications sessions among people who are geographically dispersed 
15.4.4 Event / News Management 
Monitor servers, workstations and network devices for routine and non-routine events 
Definitions for Event / News Management include: 
 SNMP – The Simple Network Management Protocol facilitates the exchange of management 
information between network devices and management systems. It is part of the Transmission 
Control Protocol/Internet Protocol (TCP/IP) protocol suite. SNMP enables network administrators 
to manage network performance, find and solve network problems, and plan for network growth. 
 Element Managers - Element managers are designed to provide management services for a 
specific set of products as opposed to all SNMP devices in a network. This is typically vendor 
specific. 
15.4.5 Community Management 
Support the administration of online groups that share common interests 
Architecture 
Component 
Twilight 
Standard 
Current Standard
Emerging 
Standard 
Target
Management 
protocols 
CMIP 
Novell 
SNMP 1.x 
SNMP V1/V2 
SNMP V3 
SNMP V2 
Network 
Monitoring 
Home grown & 
proprietary 
products 
HP OpenView 
What’s Up Gold 
NetSaint, Orion, 
Nagios, Servers 
Alive 
IFIX 
Network 
Capacity 
RMON Probes 
Lanalyzer 
eHealth 
Solar Winds 
Element 
Managers 
CiscoWorks 
Spectrum 
Optivity 
Tools 
NG Sniffer 
EtherPeak 
TCPDump 
App. Vantage 
Alterpoint 
Opsware 
12/28/2009 
Kansas Information Technology Architecture 
Page 4-102 
Version 11.2 
15.4.6 Computer / Telephony Integration 
Support the connectivity between server hardware, software and telecommunications equipment into a 
single logical system 
15.4.7 Voice Communication 
Provide telephony or other voice communications 
Documents you may be interested
Documents you may be interested