7
Converting Microsoft Office Files to HTML 7-1
7
Converting Microsoft Office Files to HTML
Inbound Refinery can convert native Microsoft Office files to HTML by using the 
native Microsoft Office applications installed on a Windows system. Content Server 
can be installed on either a Windows or UNIX platform, but for Microsoft Office to 
HTML conversions to work, Inbound Refinery must be configured on the Windows 
system where the Microsoft Office native applications are installed. Microsoft Office to 
HTML conversions require the following components to be installed and enabled on 
the specified server:
This section discusses how to work with Microsoft Office to HTML conversions and 
how to troubleshoot the conversion process. The section contains the following 
sections:
"About HTML Converter" on page7-2
"Configuring HTML Converter Settings" on page7-2
Component Name
Component Description
Enabled on Server
HtmlConverter
Enables Inbound Refinery to 
convert native Microsoft 
Office files created with 
Word, Excel, Powerpoint 
and Visio to HTML using 
the native Office 
application.
Inbound Refinery Server
MSOfficeHtmlConverterSupport
Enables Content Server to 
support HTML conversions 
of native Microsoft Office 
files converted by Inbound 
Refinery and returned to 
Content Server in a ZIP file. 
Requires that 
ZipRenditionManagement 
component be installed on 
the Content Server.
Content Server
ZipRenditionManagement
Enables Content Server 
access to HTML renditions 
created and compressed 
into a ZIP file by Inbound 
Refinery.
Content Server
Pdf rotate pages and save - rotate PDF page permanently in C#.net, ASP.NET, MVC, Ajax, WinForms, WPF
Empower Users to Change the Rotation Angle of PDF File Page Using C#
how to rotate a page in pdf and save it; how to rotate page in pdf and save
Pdf rotate pages and save - VB.NET PDF Page Rotate Library: rotate PDF page permanently in vb.net, ASP.NET, MVC, Ajax, WinForms, WPF
PDF Document Page Rotation in Visual Basic .NET Class Application
change orientation of pdf page; rotate pdf pages in reader
About HTML Converter
7-2 Product Title/BookTitle as a Variable
7.1 About HTML Converter
HTML conversion automates opening Microsoft office files in their native application, 
saves them out as HTML pages, then collects the HTML output into a compressed ZIP 
file that gets returned to Content Server.
HTML conversion can process the following types of files:
Microsoft Word 2002 through 2007
Microsoft Excel 2002 through 2007
Microsoft Powerpoint 2002 through 2007
Microsoft Visio 2007
Because Microsoft applications are Windows only, the Inbound Refinery used for 
HTML conversion must be installed on a Windows system. The Content Server 
connecting to the Inbound Refinery provider can be installed on either Windows or 
UNIX.
7.1.1 HTML Converter Process Overview
When HTML Converter is enabled to work with Inbound Refinery, native Microsoft 
Office files checked into Content Server are sent to Inbound Refinery for conversion. 
Inbound Refinery automates the process of converting the files to HTML using the 
native Microsoft Office applications. If a single HTML page is returned to Content 
Server, it is used as the web-viewable file. If conversion results in multiple HTML 
pages, the following files are returned to Content Server:
An HCSP page as the primary web-viewable rendition
A ZIP file that includes the HTML output from the Office application
Optionally, a thumbnail rendition of the native Microsoft Office file
When a user clicks on the web-viewable link in Content Server of a document 
converted to multiple HTML pages by Inbound Refinery, the HCSP page redirects the 
server to the Content Server DISPLAY_HTML_PACKAGE service. This service 
extracts the HTML page of the ZIP file to 
<WeblayoutDir>/groups/dSecurityGroup/documents/<dDocType>/~extract/<dDocNa
me>~<dRevLabel>~cachedrendition/<dDocName>~<dRevLabel>.htm, and displays it in 
the browser.
7.2 Configuring HTML Converter Settings
This section covers the following topics:
"Configuring Content Servers to Send Jobs for HTML Conversion" on page7-2
"Setting Accepted Conversions" on page7-4
7.2.1 Configuring Content Servers to Send Jobs for HTML Conversion
File formats and conversion methods are used in Content Server to define how content 
items should be handled by Inbound Refinery and the conversion options. Installing 
and enabling the 
MSOfficeHtmlConverterSupport
component on a content server adds 
four HTML conversion options on the File Formats Wizard page:
Word HTML
PowerPoint HTML
VB.NET PDF Page Delete Library: remove PDF pages in vb.net, ASP.
doc.Save(outPutFilePath). How to VB.NET: Delete Consecutive Pages from PDF. This is a VB .NET example for how to delete a range of pages from a PDF document.
pdf rotate just one page; save pdf after rotating pages
C# PDF Page Delete Library: remove PDF pages in C#.net, ASP.NET
doc.DeletePage(2); // Save the file. doc.Save(outPutFilePath); Demo Code: How to Delete Consecutive Pages from PDF in C#.NET. How
pdf reverse page order; how to reverse page order in pdf
Configuring HTML Converter Settings
Converting Microsoft Office Files to HTML 7-3
Excel HTML
Visio HTML
For a Microsoft Office document to be processed by Inbound Refinery, its file 
extension must be mapped to a format name that is associated with the HTML 
Conversion method. The added conversion options for HTML Conversion are not 
automatically mapped: they must be mapped manually. They can be set either using 
the File Formats Wizard or the Configuration Manager applet. The Configuration 
Manager applet gives you greater control over which file extenstions are mapped to 
which conversion options. Information on setting these mappings is covered in the 
following sections:
"Using the File Formats Wizard" on page7-3
"Using the Configuration Manager" on page7-3
7.2.1.1 Using the File Formats Wizard
File formats and conversion methods for Inbound Refinery can be managed in Content 
Server using the File Formats Wizard. To make changes, complete the following steps:
1.
Make sure you are logged into Content Server as an administrator.
2.
In the navigation menu, select Administration, Refinery Administration and File 
Formats Wizard. The File Formats Wizard for <server name> page is displayed.
3.
Select the Microsoft Office document file types you want to convert to HTML. The 
Conversion column lists the appropriate conversion option according to the file 
type. For example:
Word for doc, docx, dot, dotx
PowerPoint for ppt, pptx
Excel for xls, xlsx
Visio for vsd
4.
Click Update to save your changes.
5.
Make sure you are logged into the Inbound Refinery as an administrator.
6.
In the navigation menu, select Conversion Settings and then Primary Web 
Rendition. The Primary Web Rendition page is displayed.
7.
Enable Convert selected MS Office formats to MS HTML.
8.
Click Update.
7.2.1.2 Using the Configuration Manager
File formats and conversion methods for Inbound Refinery can be managed in Content 
Server using the Configuration Manager. To make changes, complete the following 
steps:
1.
Make sure you are logged into Content Server as an administrator.
2.
In the navigation menu, select Adminstration, Admin Applets. The 
Administration Applets for <server name> page is displayed.
3.
Click Configuration Manager. The Configuration Manager applet is started.
4.
Select File Formats from the Options menu.
C# PDF Page Insert Library: insert pages into PDF file in C#.net
files by C# code, how to rotate PDF document page Program.RootPath + "\\" Output.pdf"; PDFDocument doc1 doc2.InsertPages(pages, pageIndex); // Output the new
rotate one page in pdf; how to permanently rotate pdf pages
C# PDF Page Extract Library: copy, paste, cut PDF pages in C#.net
Able to extract PDF pages and save changes to original PDF file in C#.NET. C#.NET Sample Code: Extract PDF Pages and Save into a New PDF File in C#.NET.
rotate pdf pages on ipad; saving rotated pdf pages
Configuring HTML Converter Settings
7-4 Product Title/BookTitle as a Variable
5.
Select the application format for the Office document type you want to convert 
from the Format column. For example, for Microsoft Word, you would select 
application/msword.
6.
Click Edit. The Edit File Format dialog box is displayed.
7.
Select the HTML conversion option from the Conversion list appropriate to the 
Office document format you selected. For example, for application/msword, you 
would select the conversion option Word HTML.
8.
Click OK.
9.
Repeat steps 5 through 8 for all Microsoft Office formats you want to convert to 
HTML.
10.
When finished, click Close to close the File Formats page and then close the 
Configuration Manager.
11.
Restart Content Server and Inbound Refinery.
7.2.2 Setting Accepted Conversions
When installed on the refinery, the HTML Converter adds the Word HTML, 
PowerPoint HTML, Excel HTML, and Visio HTML option to the Conversion Listing 
page. This conversion option must be enabled for the refinery to perform conversions 
on items submitted by the content server.
VB.NET PDF Page Insert Library: insert pages into PDF file in vb.
outPutFilePath As String = Program.RootPath + "\\" Output.pdf" Dim doc1 doc2.InsertPages(pages, pageIndex) ' Output the new document doc2.Save(outPutFilePath
rotate pdf page few degrees; how to change page orientation in pdf document
How to C#: Rotate Image according to Specified angle
pages edit, C#.NET PDF pages extract, copy, paste, C#.NET rotate PDF pages, C#.NET VB.NET How-to, VB.NET PDF, VB.NET Word, VB.NET Excel, VB Steps to Rotate image.
pdf rotate pages separately; how to rotate a pdf page in reader
A
User Interface A-1
A
User Interface
This section contains information about the interface used with Inbound Refinery and 
enabled conversion options.
The following screens are shown in this section:
"Providers Page" on page2
"Add/Edit Outgoing Socket Provider Page" on page3
"Provider Information Page" on page7
"File Formats Wizard Page" on page7
"File Formats Screen" on page8
"Add New/Edit File Formats Screen" on page10
"Add/Edit File Extensions Screen" on page10
"Refinery Conversion Options Page" on page11
"DAM Search Fields Administration Page" on page12
"Conversion Listing Page" on page13
"Primary Web-Viewable Rendition Page" on page15
"PDF Export Options Page" on page17
"PDF Options Page" on page21
"XML Options Page" on page22
"Additional Renditions Page" on page23
"Thumbnail Options Page" on page24
"Third-Party Application Settings Page" on page26
"General OutsideIn Filter Options Page" on page27
"Distiller Engine Options Page" on page29
"CVista PdfCompressor Options Page" on page31
"OpenOffice Options Page" on page32
"Word Options Page" on page33
"Excel Options Page" on page35
"PowerPoint Options Page" on page36
"Visio Options Page" on page37
C# Create PDF from Tiff Library to convert tif images to PDF in C#
Similarly, Tiff image with single page or multiple pages is supported. Description: Convert to PDF and save it on the disk. Parameters:
pdf reverse page order online; how to rotate all pages in pdf
C# Create PDF from Word Library to convert docx, doc to PDF in C#.
Able to get word count in PDF pages. Change Word hyperlink to PDF hyperlink and bookmark. Description: Convert to PDF/TIFF and save it on the disk.
reverse pdf page order online; rotate pdf pages
Providers Page
A-2 Administrator's Guide for Conversion
"InDesign Options Page" on page38
"Timeout Settings Page" on page39
"Refinery Status Page" on page40
"Refinery Logs Page" on page41
"Console Output Page" on page42
"Conversion Job Status Page" on page42
"IBR Provider Status Page" on page43
"Agent Status Page" on page44
"Items In Queue Page" on page44
"Conversion History Page" on page45
"Conversion Detail Page" on page46
"Agent Logs Page" on page46
"User Profile Page" on page47
"Agent Management Page" on page48
"Delete Agent Page" on page49
"Configuration Information Page" on page49
"System Audit Information Page" on page50
"Configure Web Server Filter Page" on page52
"Admin Server Page" on page54
"Inbound Refinery Administration Page" on page55
A.1 Providers Page
Access this Content Server page by selecting Providers in the content server 
Administration menu. The Providers page enables you to view, add, and edit 
providers for the content server. For more information about Providers, see the Oracle 
Fusion Middleware System Administrator's Guide for Universal Content Management.
Add/Edit Outgoing Socket Provider Page
User Interface A-3
A.2 Add/Edit Outgoing Socket Provider Page
Access this Content Server page using one of the following methods:
Providers Table
Description
Provider column
The name of the provider that establishes connection to outside 
entities.
Description column
A description of the provider.
Type column
The type of provider.
Connection State column
Possible states are:
misconfigured
good
down
requires restart
Last Activity Date column
The last date and time that the provider was active.
Actions column
The Info link displays the Provider Information Page for the 
provider.
The Test link refreshes the Connection State and Last Activity 
Date columns for the provider.
Create a New Provider 
Table
Description
Provider Type column
The type of provider.
Description column
A description of the provider type.
Action column
Clicking the Add link for the outgoing provider type displays 
the Add/Edit Outgoing Socket Provider Page.
Add/Edit Outgoing Socket Provider Page
A-4 Administrator's Guide for Conversion
By clicking Add in the Action column for the outgoing provider type on the 
Providers page.
By clicking Info in the Actions column for a refinery provider on the Providers 
page, and then clicking Edit on the Provider Information page.
The Add/Edit Outgoing Provider page enables you to add a refinery as a provider to 
a content server or edit information for an existing refinery provider.
Add/Edit Outgoing Socket Provider Page
User Interface A-5
Element
Description
Provider Name field (required)
A name for the provider, which will become a subdirectory 
in the IntradocDir/data/providers directory.
Add/Edit Outgoing Socket Provider Page
A-6 Administrator's Guide for Conversion
Provider Description field 
(required)
A user-friendly description for the provider.
Provider Class field (required)
The name of the Java class for the provider. The default is 
the intradoc.provider.SocketOutgoingProvider class.
Connection Class field
Not required.
Configuration Class field
Not required.
Server Host Name field 
(required)
The host name of the server on which the refinery is 
installed.
HTTP Server Address field
The HTTP server address for the refinery. Not required 
when the refinery is on the same computer as the content 
server.
Server Port field (required)
The port on which the refinery provider will communicate. 
The default refinery port is 5555.
Instance Name field (required)
The instance name of the refinery. For example, ref2.
Relative Web Root field 
(required)
The relative web root of the refinery. When installed under 
WebLogic Server, the relative web root is /ibr/.
Use Connection Password check 
box (optional)
The target server may impose the requirement of a 
password in order to connect. The target server can allow 
connection through either a global proxy password or it 
may provide named password connections. The name can 
either be a blank value to select the global password or a 
specific name to choose one of the target's proxied 
connections.
Connection Password Name
The password required to connect to the target server. 
Leave blank to use the global password or specify the 
named connection.
Connection Password
The password necessary to connect to the target server or 
named proxy connection.
Client IP Filter
Enter the possible client IP addresses that can use the 
connection to the target server. When the target receives the 
request it will check the IP address. If it matches the IP 
address entered here then it allows the request. The wild 
card symbols * = match 0 or many and | = match either or can 
be used to match more then one potential client. The IP 
address entered here is used to message digest (one way 
hash) the password before it is persistently stored by the 
client.
Handles Inbound Refinery 
Conversion Jobs check box
Select this check box when creating a refinery provider for a 
content server.
Inbound Refinery Read Only 
Mode check box
Select this check box only when you do not want the 
content server to send new conversion jobs to the refinery. 
By default, this check box should be cleared.
Number of jobs allowed in the 
pre-converted queue field
If necessary, change the maximum number of jobs allowed 
in the content server’s pre-converted queue. The default is 
1000 jobs.
Add button
Adds a new refinery provider.
Update button
Saves your changes when updating a refinery provider.
Reset button
Resets the Add/Edit Outgoing Provider page to the last 
saved settings.
Element
Description
Documents you may be interested
Documents you may be interested