181
Search for a document
Copyright © Sohodox 2000 - 2016
be displayed in the List View pane.
Click the Double Arrow button 
to bring up the Advanced Search pane.
Select the Document Text option from the Field Name drop down, to search for text in the
document.
Select the appropriate comparison operator (i.e. contains, begins with, equal to etc.) from the
Comparison drop down. For e.g. To search for text beginning with specific alphabets use the
"begins with" operator in your query condition.
Enter the value which will be used for comparison in the Compare To box.
You can add more criteria to your search by clicking this 
button. To remove a criteria by
click this 
button.
To get a result which matches all the criteria's specified by you, select the Match all conditions
option from the Conditions drop down. To get a result which matches any criteria, select the
Match any conditions option from the Conditions drop down
Click the Search button to begin the search. The search results will be displayed in the List
View pane. 
If from the Comparison drop-down list you had chosen does not contain then the search
would have returned all documents which do not contain the text you have specified.
Related Topics
Extract Text from Document
Search for text in a document
View the Extracted Text of the Document
Pdf metadata viewer - add, remove, update PDF metadata in C#.net, ASP.NET, MVC, Ajax, WinForms, WPF
Allow C# Developers to Read, Add, Edit, Update and Delete PDF Metadata
pdf metadata viewer online; embed metadata in pdf
Pdf metadata viewer - VB.NET PDF metadata library: add, remove, update PDF metadata in vb.net, ASP.NET, MVC, Ajax, WinForms, WPF
Enable VB.NET Users to Read, Write, Edit, Delete and Update PDF Document Metadata
metadata in pdf documents; search pdf metadata
182
Sohodox Help
Copyright © Sohodox 2000 - 2016
13.4.3
Extract Text from Document
The Full Text Search feature works by extracting (OCR) text from documents and then indexing
the text. You can use the Extract and Index option to manually extract and index a document (if
you have turned off automatic indexing or wish to re-index the document).
To Extract text (OCR) from Document:
1.Select the document that you want to extract from the List View pane.
2.Right-click the document and select the Extract and Index option of the Home tab.
3.The text from the document will now be extracted and indexed.
4.
Select the document and click the More drop down arrow and select the Show Extracted
Text option of the Home tab to view the extracted text.
5.You can modify the extracted text being displayed. Click the Save button to save the
extracted text.
To Extract text (OCR) from Document using Microsoft
Office OCR engine:
1.In Sohodox, click the Sohodox button
.
2.Click the Options button. The Options window will be launched.
3.Select Use Microsoft Office OCR Engine, from Extract and Index, to make it your default
OCR Engine.
4.Click the OK button to apply the changes
5.Select the document that you want to extract from the List View pane.
6.Click the More drop down arrow and select the Extract and Index option of the Home tab.
7.The text from the document will now be extracted and indexed.
8.
Select the document and click the More drop down arrow and select the Show Extracted
Text option of the Home tab to view the extracted text.
9.You can modify the extracted text being displayed. Click the Save button to save the
extracted text.
Note: You will need to have MS Office Document Imaging installed on the system, to use
the Microsoft Office OCR Engine.  MS Office Document Imaging has been discontinued with
the launch of MS Office 2010. So text extraction using MS Office OCR Engine, only works if
the version of MS Office installed on your machine is older than MS Office 2010.
·
Sohodox uses it's built-in text extractor for MS Word (DOC, DOCX), MS Excel (XLS,
XLSX) and PDF files (PDF files which contain text and not only scanned images). In case
of any other file formats, for Sohodox to be able to extract text from a file of that particular
format, an IFilter for that file format must be installed on the user's machine.
IFilters for the following file formats are installed by default on Windows 2000/
XP/2003/2008//Vista/7 machines...
VB.NET PDF - WPF PDF Viewer for VB.NET Program
C#.NET PDF Create, C#.NET PDF Document Viewer, C#.NET PDF Windows Viewer, C#.NET search text in PDF, C#.NET edit PDF bookmark, C#.NET edit PDF metadata, C#.NET
adding metadata to pdf; batch pdf metadata
VB.NET PDF- View PDF Online with VB.NET HTML5 PDF Viewer
C#.NET PDF Create, C#.NET PDF Document Viewer, C#.NET PDF Windows Viewer, C#.NET search text in PDF, C#.NET edit PDF bookmark, C#.NET edit PDF metadata, C#.NET
batch pdf metadata editor; pdf xmp metadata viewer
183
Search for a document
Copyright © Sohodox 2000 - 2016
Ø
PPT (Microsoft PowerPoint presentation)
Ø
HTML documents
Ø
TXT documents
Related Topics
Search for text in a document
Document Full Text Search - FAQ
13.4.4
View the Extracted Text of a Document
You can view the extracted text of the document by using the Show Extracted Text option.
To View Extracted text of the Document:
1.Select the document whose extracted text you want to view from the List View pane.
2.Click the More drop down arrow and select the Show Extracted Text option of the Home
tab.
3.The extracted text will now be displayed in a window.
·
You can also switch from Sohodox OCR engine to Microsoft Office OCR engine to extract
text from documents. For more info see Extract Text from Document
Related Topics
Search for text in a document
Document Full Text Search - FAQ
13.4.5
Save the Extracted Text
You can save the changes you have made to the extracted text of a document.
To Save the Extracted text from Document:
1.Select the document that you want to extract from the List View pane.
2.
Click the More drop down arrow and select the Extract and Index option of the Home tab.
3.The text from the document will now be extracted and indexed. 
4.Click the More drop down arrow and select the Show Extracted Text option of the Home
tab.
5.The extracted text will now be displayed in a window. Make changes or correction to the
text.
6.Click the Save button to save the extracted text
·
Sohodox uses it's built-in text extractor for MS Word (DOC, DOCX), MS Excel (XLS, XLSX)
and PDF files (PDF files which contain text and not only scanned images). In case of any
How to C#: Modify Image Metadata (tag)
C#.NET PDF Create, C#.NET PDF Document Viewer, C#.NET PDF Windows Viewer, C#.NET search text in PDF, C#.NET edit PDF bookmark, C#.NET edit PDF metadata, C#.NET
read pdf metadata java; delete metadata from pdf
C# PDF Library SDK to view, edit, convert, process PDF file for C#
RasterEdge WPF PDF Viewer provides C# users abilities to view, annotate, convert and create PDF in WPF application. C#.NET: Edit PDF Metadata.
remove pdf metadata online; pdf xmp metadata editor
184
Sohodox Help
Copyright © Sohodox 2000 - 2016
other file formats, for Sohodox to be able to extract text from a file of that particular format, an
IFilter for that file format must be installed on the user's machine.
IFilters for the following file formats are installed by default on Windows 2000/
XP/2003/2008//Vista/7 machines...
Ø
PPT (Microsoft PowerPoint presentation)
Ø
HTML documents
Ø
TXT documents
Related Topics
Search for text in a document
Document Full Text Search - FAQ
13.4.6
Search for text in a document
The Document Full text search and OCR feature searches for documents based on their content
by extracting and indexing the text from documents. You will not be able to search for text in a
document if the text is not extracted from the document, for more info see Extract Text from
document
You can search for text in a document by using the Advanced Search.
To Search for Text in a Document:
1.In Sohodox, select Workspace > All Documents in the Navigation pane. The documents
will be displayed in the List View  pane.
2.Click the Double Arrow button 
to bring up the Advanced Search pane.
3.Select the Document Text option from the Field Name drop down, to search for text in the
document.
4.Select the appropriate comparison operator (i.e. contains, begins with, equal to etc.) from
the Comparison drop down. For e.g. To search for text beginning with specific alphabets
use the "begins with" operator in your query condition.
The following Comparison Operators are available
Comparison
Operator
Description
Example
Contains
Use this operator to find
values that  contains the
text that you are looking
for.
Document Text 
"contains" Acme
Does Not
Contain
Use this operator to find
values that  does not
contain the text that you
are looking for.
Document Text 
"does not contain" 
Acme
Is Empty
Use this operator to match
empty values.
Document Text "Is
Empty"
Is Not Empty
Use this operator to match Document Text "Is
C# WPF PDF Viewer SDK to view, annotate, convert and print PDF in
PDF Online. Convert PDF Online. WPF PDF Viewer. View PDF in Image to PDF. Image: Remove Image from PDF Page. Edit URL. Bookmark: Edit Bookmark. Metadata: Edit, Delete
get pdf metadata; remove pdf metadata
C# TIFF: TIFF Metadata Editor, How to Write & Read TIFF Metadata
C# TIFF - Edit TIFF Metadata in C#.NET. Allow Users to Read and Edit Metadata Stored in Tiff Image in C#.NET Application. How to Get TIFF XMP Metadata in C#.NET.
c# read pdf metadata; pdf metadata editor online
185
Search for a document
Copyright © Sohodox 2000 - 2016
non-empty values.
Not Empty"
5.
Enter the value which will be used for comparison in the Compare To box. 
6.
You can add more criteria to your search by clicking this 
button. To remove a criteria
click this 
button.
7.To get a result which matches all the criteria's specified by you, select the Match all
conditions option from the Conditions drop down. To get a result which matches any
criteria, select the Match any conditions option from the Conditions drop down.
8.Click the Search button to begin the search.
9.The search results will be displayed in the List View pane.
·
For Sohodox to be able to extract text from a file of a particular format, an IFilter for that
file format must be installed on the user's machine.
IFilters for the following file formats are installed by default on Windows 2000/XP/2003/
Vista machines...
Ø
PPT (Microsoft PowerPoint presentation)  
Ø
DOC (Microsoft Word document)  
Ø
XLS (Microsoft Excel spreadsheet)  
Ø
HTML documents  
Ø
TXT documents 
Related Topics
Extract Text from Document
View the Extracted Text of the Document
C# HTML5 PDF Viewer SDK to view PDF document online in C#.NET
PDF Online. Convert PDF Online. WPF PDF Viewer. View PDF in Image to PDF. Image: Remove Image from PDF Page. Edit URL. Bookmark: Edit Bookmark. Metadata: Edit, Delete
remove metadata from pdf file; extract pdf metadata
VB.NET PDF Library SDK to view, edit, convert, process PDF file
PDF Metadata Edit. Offer professional PDF document metadata editing APIs, using which VB.NET developers can redact, delete, view and save PDF metadata.
pdf metadata editor; remove metadata from pdf online
186
Sohodox Help
Copyright © Sohodox 2000 - 2016
13.4.7
Automatically Extract text from documents
You can automatically extract text from documents on adding by selecting the Automatically
extract text from documents while adding option from the Options window.
To Automatically Extract text (OCR) from the Document:
1.In Sohodox, click the Sohodox button
.
2.
Click the Options button. The Options window will be launched.
3.
Select the DB options node in the left pane. The DB options will now be displayed in  the
right pane.
4.Check the Automatically extract text from documents on check-in option.
5.Click the OK button to apply the changes.
·
You can also switch from Sohodox OCR engine to Microsoft Office OCR engine to extract
text from documents. For more info see Extract Text from Document
·
Sometimes for slower machines you may want to turn off the automatic extraction and
indexing of documents.
·
Sohodox uses it's built-in text extractor for MS Word (DOC, DOCX), MS Excel (XLS,
XLSX) and PDF files (PDF files which contain text and not only scanned images). In case
of any other file formats, for Sohodox to be able to extract text from a file of that particular
format, an IFilter for that file format must be installed on the user's machine.
IFilters for the following file formats are installed by default on Windows 2000/
XP/2003/2008//Vista/7 machines...
Ø
PPT (Microsoft PowerPoint presentation)
Ø
HTML documents
Ø
TXT documents
Related Topics
Search for text in a document
Document Full Text Search - FAQ
13.4.8
OCR document that contains text in a different language
You can now OCR a document that contains text in language other than English. For e.g. if you
have a document that contains text in the Danish language then you can configure the OCR
engine to recognize the Danish language text. This option will only works if you are using the
Microsoft Office OCR engine and only recognizes the languages supported by the MS Office
OCR engine.
To OCR document that contains text in a different
187
Search for a document
Copyright © Sohodox 2000 - 2016
language:
1.
In Sohodox, click the Sohodox button
.
2.Click the Options button. The Options window will be launched.
3.From the Extract and Index section, select the Use Microsoft Office OCR Engine option
to make it your default OCR Engine.
4.In Select the language to use drop-down, select the language to use to OCR the
document. By default the System language is used for text recognition.  
5.Click the OK button to apply the changes.
Related Topics
Search for text in a document
View the Extracted Text of a Document
13.5
Save a Search criteria
You can save the frequently used query for later use from the Advanced Search Panel.
To Save a Query:
1.In Sohodox, select Workspace > All Documents in the Navigation pane. The documents
will be displayed in the List View
pane.
2.Click the Double Arrow button 
to bring up the Advanced Search pane.
3.Select a column name (indexing field) from the Field Name drop down, to search in a
particular column (indexing field).
4.Select the appropriate comparison operator (i.e. contains, begins with, equal to etc.) from
the Comparison drop down.
5.Enter the value which will be used for the comparison in the Compare To box. 
6.
You can add more criteria to your search by clicking this 
button. To remove a criteria
click this 
button.
7.To get a result which matches all the criteria's specified by you, select the Match all
conditions option from the Conditions drop down. To get a result which matches any
criteria, select the Match any conditions option from the Conditions drop down
8.Click the Save As... button to save this query. The Save Search window will be launched.
9.Enter a name for the query in the Name box, enter a short description about the query in
the Description box.
10.Click the OK button to save the query. 
To view the saved query click the Saved Searches > Custom Search node in Workspace.
188
Sohodox Help
Copyright © Sohodox 2000 - 2016
·
To apply a saved query click the Saved Searches > Custom Search node and select the
Saved Search in the list. The search result will be displayed in the List View pane.
·
To clear the Query Result, click the Clear button 
.
Related Topics
Advanced Search
Export the Search Result
189
Search for a document
Copyright © Sohodox 2000 - 2016
13.6
Prompt user for the condition value when applying a saved
search
You can create a saved search that prompts you to enter the condition value everytime you
apply that saved search.
To Prompt the user for Condition Values when applying a
Saved search:
1.In Sohodox, select Workspace > All Documents in the Navigation pane. The documents
will be displayed in the List View
pane.
2.Click the Double Arrow button 
to bring up the Advanced Search pane.
3.Select a column name (indexing field) from the Field Name drop down, to search in a
particular column (indexing field).
4.Select the appropriate comparison operator (i.e. contains, begins with, equal to etc.) from
the Comparison drop down.
5.Enter the value which will be used for the comparison in the Compare To box. 
6.You can add more criteria to your search by clicking this 
button. To remove a criteria
click this 
button.
7.To get a result which matches all the criteria's specified by you, select the Match all
conditions option from the Conditions drop down. To get a result which matches any
criteria, select the Match any conditions option from the Conditions drop down
8.Click the Save As... button to save this query. The Save Search window will be launched.
9.Enter a name for the query in the Name box, enter a short description about the query in
the Description box.
10.Check the Prompt for condition values before searching option to prompt the user to
enter the values for the search condition.
11.
Click the OK button to save the query. 
12.
Now when you will apply the saved search, a box will pop-up, asking you to enter the
conditions value to perform the search.
·
To apply a saved query click the Saved Searches > Custom Search node and select the
Saved Search in the list. The search result will be displayed in the List View pane.
·
To clear the Query Result, click the Clear button 
.
Related Topics
Advanced Search
Export the Search Result
190
Sohodox Help
Copyright © Sohodox 2000 - 2016
13.7
Print the Search Results along with the Query Conditions
When you print search results that are displayed in the List View pane, you can now choose to
print the conditions used in that search at the top of the search results. This feature helps in
quickly identifying the conditions used to generate the search results. 
To Print the Search results along with the Query
conditions:
1.Use Quick Search/Advanced Search to find the documents. The search result will be
displayed in the List View pane.
2.On the Home tab click the Print drop-down and select the Print List option. This will bring
up the Print window.
3.Check the columns you want to print from the Columns pane. You can rearrange the
columns order as per your wish by using the Up 
and Down 
button.
4.Select the Print All Pages option to print the search result.
·
If you want to print the search result displayed on the current page then select the 
Print Current Page option.
·
If you want to print only the selected search result then select the Print Selected
option.
5.Check the Print Columns Names option to print the column.
6.Click the Next button to go to the next page.
7.Select the printer from the Printers drop down to print the data. Click the Settings button
to select the printer's settings.
8.You can click the Print Preview... button to view the data that is going to be printed.
9.Select the line spacing for the data that is going to be printed from the Line Spacing drop
down.
10.Click the Custom Header button to insert the Query Condition in the header. 
The Header is split into three sections, Left, Center and Right. You can enter the Query
Condition in any of these sections, the Query Condition will be printed on the left, center
or right side of the document. 
To insert the advanced search conditions click the Search Conditions button. Click the Ok
button to save the settings
11.Click the Custom Footer button to enter information in the footer of the document. 
This will bring up the Footer dialog.
This dialog will allow you to insert additional information in the footer. The Footer is split
into three sections, Left, Center and Right. You can enter text, page number, system
date, time as well the search conditions, in any of these sections. This information will
then be printed on the left, center or right side of the document. 
·
To format the entered text, click the Font button.
Documents you may be interested
Documents you may be interested