itextsharp c# view pdf : Extract images from pdf files Library software class asp.net winforms .net ajax Discovery_Cracker_Readme_5-4-0-220-part1431

9/11/2009  
CT Summation Discovery Cracker® 
Version 5.4.0 
Readme 
Discovery Cracker® version 5.4.0 
© 2009 CT Summation, a Wolters Kluwer business. All rights reserved. 
All product names referenced herein are  
trademarks of their respective companies. 
This Readme file contains the following sections:
•  New Features of Discovery Cracker Version 5.
4.0
•  Upgrade Instructions and Notes
•  Contact Us
•  Important Instructions Not Provided Elsewhere
•  Documentation
•  Software Constraints
•  Issues Resolved From Previous Releases
•  Known Issues and Workarounds
New Features of Discovery Cracker 
Version 5.4.0 
•  Searchable PDF – We are pleased to announce that 
you now have the option to render documents to the 
searchable PDF format. 
At this time, Discovery Cracker does not provide the 
ability to produce a searchable PDF from a 
nonsearchable document such as an image file or a 
nonsearchable PDF. 
In addition, PDF source files will not be rendered to a 
PDF format; they will simply be copied to the 
appropriate folder during processing.  This creates a 
limitation regarding the ability to change the 
attributes of a source PDF file.  For example, you will 
not be able to take a color PDF and make it black and 
white, nor will you be able to change the DPI. 
•  Monitor Workflow Manager Activity – In past 
versions of Discovery Cracker you had to go to the 
Workflow Manager computer to see what was 
happening on your DC Engines.  Or you could go to 
each DC Engine computer and see what was going on.  
Now, from Discovery Cracker Console you can see 
what item is being processed by which DC Engine.  
Open Discovery Cracker Console. On the menu bar 
select Tools, then select Monitor Workflow Manager 
Activity.  You can choose to display a snapshot of 
documents being processed per DC Engine computer 
or per job. You can manually refresh the snapshot or 
select to have the snapshot refreshed automatically at 
regular intervals. 
•  QC Console is Available at the Job Level – With 
Discovery Cracker 5.4.0 when you select a job in the 
navigation pane, the QC Console tab is available. 
When you select the tab and open QC Console, all 
documents in the group or view are displayed. 
•  Apply Settings to Multiple Document Type Groups 
– When choosing the correct settings with which to 
process your documents, you can now apply the 
settings to multiple document type groups at the 
same time. 
•  Password Cracking for Microsoft Excel Worksheets 
– During processing of a Microsoft Excel workbook we 
will automatically attempt to remove the worksheet 
protection, including password protection, at the 
worksheet level if you have selected the Remove 
worksheet level protection option in the Excel 
render settings (under Worksheet options).  By 
selecting this option we will utilize a brute force 
functionality that will iterate through up to 196,000 
times to attempt to crack the password on the 
worksheet.   
Please note that this can make processing of 
Microsoft Excel spreadsheets take longer than 
expected if you have quite a few that are worksheet 
password protected.  However, on those Microsoft 
Excel documents that do not have a password 
protection at the worksheet level, the processing will 
not be impeded by this process. 
•  Import Keywords into a View – You can now import 
a list of keywords into a view when using the Is In or 
Is Not In operators.  This operator is not available for 
all fields. Additional functionality will be added to 
Discovery Cracker in future releases to work with the 
other operators.  To use this feature, you must first 
create a .txt file containing a single list of values, with 
each value on a separate line. 
•  Field Selection During Export – In previous versions 
of Discovery Cracker you could only choose a field 
once during an export.  You can now select the same 
field multiple times.  This is helpful if you need a 
different formatting for a particular field or if you 
need the same data represented in a field with two 
different names, such as for the date and time. 
•  Manual Printing – You can now manually print 
documents to TIFF and text or to PDF with only 
Extract images from pdf files - Select, copy, paste PDF images in C#.net, ASP.NET, MVC, Ajax, WinForms, WPF
Support PDF Image Extraction from a Page, a Region on a Page, and PDF Document
extract text from pdf image; pdf image text extractor
Extract images from pdf files - VB.NET PDF Image Extract Library: Select, copy, paste PDF images in vb.net, ASP.NET, MVC, Ajax, WinForms, WPF
Support PDF Image Extraction from a Page, a Region on a Page, and PDF Document
extract image from pdf in; how to extract a picture from a pdf
CT Summation Discovery Cracker | Readme 5.4.0  
2
Discovery Cracker Console installed on your 
computer. 
•  Adobe Acrobat 9 support – Discovery Cracker now 
supports the use of Adobe Acrobat 9.  You may use 
Adobe Acrobat version 7, 8, and 9.  We have removed 
the support for using Adobe Acrobat version 6.  Please 
note that Discovery Cracker requires that you install 
either the Standard or Professional editions of Adobe 
Acrobat.  Discovery Cracker does not work with 
Adobe Acrobat Reader. 
Upgrade Instructions and Notes 
For customers currently using Discovery Cracker 5.3.1: 
1.  Close all programs and all Discovery Cracker 
components on all Discovery Cracker 5 
computers.   
2.  Restart all Discovery Cracker computers before 
upgrading. 
3.  Run Discovery Cracker Update 5.4.0.x.exe on 
each computer in the following order: 
a.  Workflow Manager computer 
b.  DC Engine computer 
c.  Discovery Cracker Console computer 
d.  DC Detective computer 
4.  After completing the upgrade, restart your 
computers. 
It is important to perform the upgrade on ALL of your 
computers before attempting to start the individual 
components. 
If you are using a series 5 version of the software, but not 
the 5.3.1 version, please contact Discovery Cracker 
Product Support for assistance in obtaining the necessary 
updates. 
Upgrading and Enhancements – On upgrade to 5.3 and 
subsequently to 5.3.1 some new enhancement upgrades 
could not be automated.  These two enhancements are 
the Save Errors for the project error database table and 
the ability to turn off the indexing that is done during 
processing.  If you have been upgrading Discovery Cracker 
from prior to 5.3, please contact Product Support for 
assistance in updating your program to be able to use 
these two functions. 
Upgrading with SQL Server Express – SQL Server Express 
has a 4 gigabyte per database limitation.  If you have been 
using this version of SQL Server and you have a project 
database that is close to or exceeds this limitation, you 
will have difficulty upgrading Discovery Cracker.  Please 
contact Product Support for assistance. 
Contact Us
Please feel free to contact us with any comments or 
questions you may have. 
Our business office hours are 8 a.m. to 5 p.m. Eastern 
time, Monday through Friday. 
Hours for Discovery Cracker Product Support are 8 a.m. to 
7 p.m. Eastern time, Monday through Friday. 
Office 
Mailing 
Address 
1180 Celebration Blvd., Suite 104 
Celebration, FL 34747-4950 
Phone
407-566-4300 
Fax
407-566-4301 
Web Site
http://www.discoverycracker.com 
Product Support 
Phone
866-833-5377 
E-mail
dcsupport@wolterskluwer.com
Updates and Information 
Phone 
407-566-4268 
E-mail 
info@discoverycracker.com 
Important Instructions Not Provided 
Elsewhere  
Following are topics that were not ready in time to include 
in the Discovery Cracker Environment Setup and Installation 
Guide or User Guide for version 5.4: 
WinZip 12 instructions – If you use WinZip 12 as your 
archive application, when you process archived 
(compressed) files, Windows Explorer will remain open 
during processing.  
To prevent this from happening, you need to perform the 
following steps on each DC Engine computer on which 
WinZip 12 is installed. 
1.  Create a test zip file. 
2.  Open the file in WinZip. 
3.  On the Options menu, make sure that Save 
Settings on Exit is checked. 
VB.NET PDF Text Extract Library: extract text content from PDF
Extract highlighted text out of PDF document. Image text extraction control provides text extraction from PDF images and image files.
pdf image extractor c#; extract images from pdf file
C# PDF Text Extract Library: extract text content from PDF file in
Ability to extract highlighted text out of PDF document. Image text extraction control provides text extraction from PDF images and image files.
extract vector image from pdf; pdf image extractor online
CT Summation Discovery Cracker | Readme 5.4.0  
3
4.  Select the Extract icon. 
5.  In the Extract dialog box, clear the Open 
Explorer window check box. 
6.  Select Extract. 
PDF Render Settings – PDF render settings do not include 
the Page size setting or the Orientation setting, as 
indicated on pages 231 and 233 of the User Guide. 
You control orientation and page size settings for 
rendering to TIFF and PDF from settings available on the 
User-Selected Application tab. To find those settings, 
you can search for the keywords “orientation” and “page 
size” in Appendix A, “Task Settings,” of the User Guide. 
Documentation 
The following documents are installed in the 
Documentation folder in the Discovery Cracker program 
folder. You can access them from the Start menu: 
Start>Programs or All Programs>Discovery 
Cracker>Documentation. 
•  Environment Setup and  Installation Guide for 
Discovery Cracker 5.4  
•  Field List for Discovery Cracker 5.4  
•  Readme for Discovery Cracker 5.4.0 
•  Supported File Types for Discovery Cracker 5.4 
•  User Guide for DC Detective 5.4 
•  User Guide for Discovery Cracker 5.4  
Software Constraints 
As with any software, Discovery Cracker has limitations 
that should be noted for the awareness of our customers.  
Most of these limitations have already been noted in the 
User Guide. However, listed below are limitations that are 
not otherwise noted. 
These limitations are: 
Microsoft Office Project 2007 – Files created with 
Microsoft Office Project 2007 are not yet supported. 
Exports – When running exports you can only run one 
type of export at a time in a given project.  However, you 
can run multiple exports of different types simultaneously. 
Working from a Mapped Drive – Discovery Cracker does 
not allow you to work from a mapped drive.  Everything 
must be accessible using a UNC path, including files used 
for the import feature. 
Job
Scheduling
– 
If you create a job to run following the 
completion of another job within the same project and 
group, but the second job depends on the first job for 
count of items, the second job may not perform the 
requested action on all items. 
For example, if you create a group to process data in a 
folder and then create a job to perform the first three 
actions (Initial Spin Through, File Spin Through, and 
Extract Metadata) on that group, and immediately create 
a job to perform the Render action and have the second 
job follow the first, the job for Render will run after the 
first job as requested, but because there were no items for 
it to perform the action on at the time it was created, no 
documents are rendered. 
Processing Microsoft Access Databases
Internal 
metadata is not collected on Microsoft Access files.  
Because of limitations with the handling of Access files, we 
are unable to extract much of the internal metadata; 
however, we extract the body text (table information) 
from the databases. 
VB.NET PDF File Merge Library: Merge, append PDF files in vb.net
Merge two or several separate PDF files together and into Able to integrate VB.NET PDF Merging control to Components to combine various scanned images to PDF
extract image from pdf java; extract images pdf acrobat
C# PDF Convert to Jpeg SDK: Convert PDF to JPEG images in C#.net
may customize the names of all converted JPEG image files in .NET Following demo code will show how to convert all PDF pages to Jpeg images with C# .NET.
how to extract images from pdf in acrobat; extract jpeg from pdf
CT Summation Discovery Cracker | Readme 5.4.0  
4
Issues Resolved From Previous Releases 
The following issues from previous versions of the Discovery Cracker program have been resolved. You no longer need to use 
the previously described workarounds. 
Affected Process 
Description 
Comment 
Issue 
Number 
DC Detective 
If you remove access to all projects in a DC 
Detective access role, the user assigned this 
role still has access to all projects after 
logging into DC Detective. 
This issue has been resolved.  
10162 
DC Detective 
When using the advanced search function, 
Clear Search is not working properly. 
This issue has been resolved. 
11659 
Endorsing 
The font size chosen during endorsement of 
the TIFF images is not being saved.  
Discovery Cracker will endorse everything 
using an 8.25 font. 
This issue has been resolved. 
11228 
Exports 
The time stamp in the Data Ddelimited 
Text File Export and CT Summation DII 
Export changes depending on which time 
zone the DC Engine computer that is 
performing the export job is set to. 
This issue has been resolved. 
11711 
Exports 
Within the Ringtail Export if you import 
saved fields, they are not being saved to the 
list of fields to populate in the export_extras 
table. 
This issue has been resolved. 
11742 
Exports 
When exporting to a Ringtail database, if the 
data contains a large body field, an error 
message (“Query too complex") occurs at 
the job level and the export fails. 
This issue has been resolved. 
11755 
Exports 
When using custom fields on Class 2 and 
Class 3 of the CT Summation DII Export, 
the @C token is not present for any record 
that does not have a value in Discovery 
Cracker’s database.   
This causes a problem in the iBlaze, 
Enterprise, and CaseVantage applications 
because they are designed to inherit the 
value for any @C token into the next record 
unless a "change value" @C token is put into 
the current record. 
For example, take the field "Importance".  If 
you choose to add this as a custom field and 
if email record 1 contains a value of "@C 
Importance High" but for email record 2 
there is nothing available, your export will 
not contain an "@C Importance" token in 
email record 2. When you import this file 
into any of the three aforementioned 
This issue has been resolved. 
Now anytime you select a 
custom field, this token will 
appear on every record. If 
the record does not have a 
value for the token, it will be 
blank to reset the token 
during your import into the 
CT Summation products. 
11773 
C# PDF Convert to HTML SDK: Convert PDF to html files in C#.net
Embed converted HTML files in HTML page or iframe. Use JS (jquery) to control PDF page navigation. Export PDF images to HTML images.
how to extract text from pdf image file; extract images from pdf files without using copy and paste
VB.NET PDF Convert to HTML SDK: Convert PDF to html files in vb.
Embed converted html files in html page or iframe. Export PDF form data to html form in .NET WinForms and ASP.NET. Turn PDF images to HTML images in VB.NET.
online pdf image extractor; extract image from pdf acrobat
CT Summation Discovery Cracker | Readme 5.4.0  
5
Affected Process 
Description 
Comment 
Issue 
Number 
applications, the "@C Importance High" 
value from email record 1 will be inherited 
into email record 2 and onward until 
another "@C Importance" token is seen in 
the DII. 
Exports 
When selecting one volume to export out of 
many volume sessions with the same prefix, 
you get the following error message: "Failed 
to enable constraints. One or more rows 
contain values violating non-null, unique, or 
foreign-key constraints." 
This issue has been resolved 
11785 
Job Scheduling 
If you create a job to run following the 
completion of another job within the same 
project and later decide to run the job 
immediately, the changes are not being 
properly saved and the job will never run. 
The job continues to show a status of 
Scheduled in the navigation pane and the 
Jobs tab. 
This issue has been resolved. 
10492 
Postprocessing 
When setting up your Bates number session, 
if you do not provide enough numbering 
digits for your data set, the postprocessing 
job will go into a paused state immediately. 
This issue has been resolved. 
While your job will still go 
into a paused state, the Jobs 
tab will now show you why 
this has occurred. 
For Page Number Digits, 
we have updated the default 
number of digits to 6, which 
should prevent most of the 
problems. However, when 
setting Document Number 
Digits, Child Number 
Digits, and Page Number 
Digits, you must be sure to 
provide enough digits for the 
data set you will be 
processing. 
11453 
Processing 
When using the deduplication functionality, 
some attachments are getting rendered 
even though they are duplicates of 
previously processed documents. 
This issue has been resolved. 
10245 
Processing 
If your database is SQL Server 2005 
Enterprise Edition and reindexing starts 
while the Initial Spin Through action is 
being performed on a large container item 
(Folder, PST, NSF), all the existing items are 
deleted from the Items table and Initial 
Spin Through starts over again. 
You can now control 
whether or not to allow 
indexing to occur and set the 
timer for indexing to a 
higher value to prevent this 
from happening.  Please 
contact Product Support for 
assistance. 
11055 
C# PDF File Merge Library: Merge, append PDF files in C#.net, ASP.
Combine scanned images to PDF, such as tiff, jpg, png, gif, bmp XDoc.PDF) is designed to help .NET developers combine PDF document files created by
extract image from pdf; some pdf image extractor
VB.NET PDF Page Extract Library: copy, paste, cut PDF pages in vb.
VB.NET: Extract All Images from PDF Document. This is an example that you can use it to extract all images from PDF document. ' Get page 3 from the document.
extract image from pdf using; extract images from pdf acrobat
CT Summation Discovery Cracker | Readme 5.4.0  
6
Affected Process 
Description 
Comment 
Issue 
Number 
Processing 
PDF files created by some tools, such as 
Ghostwriter, do not allow Discovery Cracker 
to extract the Body field. 
This issue has been resolved. 
11416 
Processing 
When processing Lotus Notes files, the time 
zone (which is passed during processing for 
the purposes of updating the image files) is 
set on the DC Engine computer. If the DC 
Engine crashes, in some instances the time 
zone from the project information is left as 
the setting on the DC Engine computer. 
This can cause problems with single-box 
users who have their SQL Server on the 
same computer as their DC Engine. The SQL 
Server’s time may be affected. 
This issue has been resolved. 
11445 
Processing 
After a long period of processing, Microsoft 
Word begins to throw errors that Word has 
run out of memory. 
This issue has been resolved. 
11489 
Processing 
When processing EML files, the CC, BCC, 
and SentTo fields are not being populated. 
This issue has been resolved 
11728 
Processing 
Discovery Cracker cannot process read-only 
files, including NSF and PST files. 
This issue has been resolved. 
11852 
Rendering 
Charts for some Microsoft Excel 
spreadsheets are not properly rendered.  
While the data is rendered correctly, the 
chart itself is not rendered. 
This issue has been resolved. 
11465 
Settings 
If you change folder settings and then cancel 
out of the Folder Settings dialog box, the 
changes you made are saved. 
This issue has been resolved. 
10453 
Status 
When deduplication is enabled in a project 
and set to deactivate the items found to be 
duplicates, only the main item has the 
status of Inactive – Duplicate.  The child 
items have the status of the last processed 
action, such as Extract Metadata or Render. 
This issue has been resolved. 
11332 
User Interface 
You cannot choose a file server that does 
not appear in the My Network Places\Entire 
Network\Microsoft Windows Network of 
Windows Explorer. 
This happens when the file 
server is not on the same 
workgroup or domain as the 
Discovery Cracker 
components.   
There is a method that can 
be used to bypass this 
behavior, but it is provided 
on a case by case basis.  
Please contact Product 
Support if you need further 
information on how to do 
this. 
10115 
C# PDF File Split Library: Split, seperate PDF into multiple files
Also able to combine generated split PDF document files with other PDF files to form a new PDF file. Split PDF Document into Multiple PDF Files in C#.
how to extract images from pdf; extract color image from pdf in c#
CT Summation Discovery Cracker | Readme 5.4.0  
7
Affected Process 
Description 
Comment 
Issue 
Number 
Views 
If you create a view and choose multiple 
fields before selecting the operator and 
criteria, only the first field alphabetically will 
be added to the view statement. 
This issue has been resolved. 
10432 
Views 
When creating a view that contains criteria 
that exceed 4,000 characters, the view 
generates an error. 
This issue has been resolved. 
11376 
Known Issues and Workarounds 
The following issues are known to exist within the current version of the software.  If applicable, a workaround has been 
provided to help you avoid any problems.  Please read through these issues carefully before processing. 
Affected Process 
Description 
Workaround 
Issue 
Number 
Exports 
Using the folder structure naming option in 
the Ringtail export may cause duplicate 
document IDs which will prevent the export 
from being successfully created. 
Order the documents by 
Original File Path prior to 
Bates numbering them. 
10288 
Exports 
When using the CT Summation DII exports, 
the option to monitor the DII file size is set 
to 0 by default.  If you select this option and 
do not set an appropriate limit, you will get 
a blank DII file. 
Set your DII maximum file 
size to the desired limit 
when using this option. 
11241 
Exports 
Intermittently, the CT Summation DII Class 
2 export duplicates records for a PST job. 
If you see this occur, please 
contact Product Support 
immediately. 
11309 
Exports 
The CT Summation DII Class 2 & Class 3 
default fields include the @Storeid field; 
however, intermittently this field is not 
included in the resulting DII output. 
No known workaround at 
this time. 
11386 
Exports 
When using the Data Delimited Text File 
Export and you select a session from the 
drop-down box, the Documents to Process 
area doesn't match the Before 
Postprocessing or After Postprocessing 
selection for the session. It displays 
whatever the previously selected session 
was. 
Select the settings you need 
for the session and then 
select Update Session. 
11395 
Exports 
When using the DocuLex 5 Export the 
following error is generated when a data set 
exceeds the limitations of the output 
format: 
Exception of type 
'System.OutOfMemoryException' was 
thrown. 
The DocuLex 5 Export is a 
FoxPro format which has 
several limitations.  Please 
keep your data set within 
the bounds of these 
limitations.  For further 
information on these 
limitations, please review 
the following:  
http://fox.wikis.com/wc.dll?
11435 
CT Summation Discovery Cracker | Readme 5.4.0  
8
Affected Process 
Description 
Workaround 
Issue 
Number 
Wiki~VisualFoxProLimits~VF
Exports 
The EDRM XML export fails when the Body 
field contains certain invalid characters. The 
characters are hexadecimal value 0x1B. 
Recrack the document.  On 
the Get Body Text tab of 
the Extract Metadata 
action, clear the Extract 
body text check box. 
11495 
Exports 
When working with the Ringtail Export, if 
the field value of the Discovery Cracker 
metadata exceeds the output value in the 
Ringtail database, the data will not be 
populated. 
Whenever possible use the 
Split Values option in the 
Field Selector dialog box 
(when you select Select 
Fields on the Party Table 
tab or the Extra Table tab). 
11676 
Folders 
If you select the option to create a folder 
and do not provide a name for the folder, 
New Folder will be provided for the name.  
However, if you select the refresh button 
before adding a project to the folder, New 
Folder will be removed from the Discovery 
Cracker Console navigation panel. 
Provide a name for the 
folder as you create it. 
10444 
Import Job 
Settings 
If you import job settings from another 
project for a CT Summation DII Export job, 
the save location is from the other project, 
not the one you are in. In one circumstance 
this had a truncation problem on the relative 
pathing option due to the difference in size 
of the Volumes path from a different 
project. 
After performing the import 
job settings, be sure to 
update the file path 
information for the export 
locations. 
11831 
OCR 
If you mark an item that has been OCR’d to 
re-OCR and disable the OCR option for that 
document type group, the data in the All 
Text field is not deleted. 
You can recrack and 
rerender documents to clear 
the All Text field. 
11248 
OCR 
If you select to render documents with the 
OCR option turned off and then select to 
rerender the documents with the OCR 
option turned on, most of the items do not 
complete and an error message is received: 
"Deleted row information cannot be 
accessed through the row." 
If you need OCR data and 
you have images, select the 
Redo OCR option rather 
than the Rerender option 
while in QC. 
11889 
Paper Printing 
The endorsement functionality is not 
currently working during paper printing. 
If you need to print 
endorsed TIFF images, 
endorse them during 
postprocessing, then print 
the TIFF images to paper. 
See chapter 14, “Endorsing 
Documents,” on page 162 of 
the User Guide for Discovery 
Cracker 5.2 
10530 
Postprocessing 
After creating a Bates number session and 
then selecting it, you are allowed to change 
some of the settings; but these changes are 
If you find that you have set 
something incorrectly while 
creating a Bates number 
10456 
CT Summation Discovery Cracker | Readme 5.4.0  
9
Affected Process 
Description 
Workaround 
Issue 
Number 
not saved. 
session, you need to create a 
new session to adjust your 
settings. 
Postprocessing 
When creating a Bates number session, if 
you select a field to sort the records by, save 
the changes and then go back into the Sort 
Field Selector dialog box and select another 
field to add to the existing field selection, 
the previous selection is removed. 
When choosing your sort 
fields, select or re-select all 
of the fields you wish to sort 
your records by before 
exiting the Sort Field 
Selector dialog box. 
10481 
Postprocessing 
When creating jobs for postprocessing, 
Discovery Cracker allows you to create 
multiple jobs within the same project, but if 
the jobs are run at the same time, only the 
job that gets to the Workflow Manager first 
is able to run through completion. Any 
subsequent job goes into a not created state 
and can never be run. Even pausing and 
restarting the job does not solve the 
problem. 
Do not create multiple 
postprocessing jobs within 
the same project. 
10487 
Postprocessing 
The Bates number padding for the document 
counter is not retained when the Include 
Bates number prefix in the file name 
option is cleared (when creating a volume 
session). 
For example, if you set the Document 
Number Digits to 4 and the Page Number 
Digits to 6 (when creating a Bates number 
session) and then you process 10 
documents, each resulting TIFF image 
should have a name something like 
0001.000001 or 0010.000003.  Instead, the 
padding is removed from the document 
number digits and the resulting TIFF image 
has a name like 01.000001. 
No known workaround at 
this time. 
This only applies when you 
include Document Number 
Digits in your Bates 
numbering scheme. 
11502 
Postprocessing 
When selecting to include the native files 
during the packaging stage of 
Postprocessing, Access databases sometimes 
result with a copy in the volume folder that 
will generate a different MD5Hash value 
when run back through processing. 
No known workaround at 
this time. 
11847 
Processing 
During processing, some applications, such 
as Microsoft Word, must be opened in a 
visible manner in order to work properly. The 
documents that are processed using these 
applications are opened during processing; 
however, when processing is complete for 
the individual documents, the last document 
processed remains open in the application 
window. 
While the applications used 
during processing will 
remain open, the last 
document being processed 
will be closed so you will 
only see an empty 
application window.  
At this time the only 
exception to this update is 
10217 
CT Summation Discovery Cracker | Readme 5.4.0  
10
Affected Process 
Description 
Workaround 
Issue 
Number 
Lotus Notes, which still 
remains open with the last 
NSF file open as well. 
The applications are being 
left open to limit the 
overhead of reopening when 
the next job is assigned to 
the DC Engine for 
processing. 
Processing 
The English currency symbol (the pound sign 
[£]) is converted to a question mark [?] when 
rendering .msg files, but the same character 
is not converted when it is found in 
Microsoft Office documents. 
This has been partially 
resolved with this version, 
but there is an additional 
character that is being added 
(Ẫ) in front of the pound 
symbol. 
10237 
Processing 
If the LastModifiedDate value is invalid, 
Discovery Cracker is unable to process the 
file. 
No known workaround at 
this time. 
10410 
Processing 
When processing Chinese documents, the 
text file produced is missing blank lines.  The 
Body field does not contain any line breaks 
and is missing any underlined words. 
No known workaround at 
this time. 
11098 
Processing 
If an archive file contains files with foreign 
language characters in the file name, the 
Body field is not collected correctly. 
No known workaround at 
this time. 
11162 
Processing 
During the course of processing, temporary 
files are stored in the local temp folder.  On 
occasion, these files are not removed at the 
end of processing. 
It is recommended to 
periodically clear out the 
temp folders used by 
Discovery Cracker.  Please 
contact Product Support for 
assistance. 
11186 
Processing 
If you select a specific user.id file and 
password to use for Lotus Notes NSF 
processing, you may receive an error during 
processing: "One or more certificates in your 
Notes id have expired". 
This issue has been resolved 
by using a Click Robot entry. 
However, there is now a 
security dialog box that 
cannot be handled by Click 
Robot.  You will need to 
respond to this security 
dialog box by selecting the 
option “Start Trusting this 
signer” in order to continue 
processing the NSF. 
11234 
Processing 
Discovery Cracker recognizes Microsoft 
Snapshot documents as Microsoft Cabinet 
document type. 
Use the file extension 
override function (Override 
Document Types) in the 
Manage File Extensions 
dialog box to control which 
document type group is 
assigned these documents. 
See “Managing File 
11372 
Documents you may be interested
Documents you may be interested