Name
Description
Business 
Rules
Enables you to use the business rule flow packages that are created in SAS 
Business Rules Manager in the context of a SAS Data Integration Studio job. 
You can import business rule flows, specify flow versions, map source table 
columns to required input columns, and set business rule options. The Business 
Rules transformation enables you to map your source data and output data into 
and out of the rules package. Then, the SAS Data Integration Studio job applies 
the rules to your data as it is run. When you run a job that includes a rules 
package, statistics are collected, such as the number of rules that were triggered, 
and the number of invalid and valid data record values. You can use this 
information to further refine your data as it flows through your transformation 
logic. For more information, see “Using a Business Rule Flow in a Job” on page 
655.
Compare 
Tables
Enables you to detect changes between two tables such as an update table and a 
master table and generate a variety of output for matched and unmatched 
records. For more information, see “Comparing Tables” on page 528.
Data 
Transfer
Moves data directly from one machine to another. Direct data transfer is more 
efficient than the default transfer mechanism. For more information, see 
“Moving Data Directly from One Machine to Another Machine” on page 708.
Data 
Validation
Cleanses data before it is added to a data warehouse or data mart. For more 
information, see “Validating Product Data” on page 669.
Enterprise 
Decision 
Manageme
nt
Maps physical data from an Enterprise Decision Management flow package to 
decision flows. The output tables attached to the transformation produce 
decision-making results from the mapped input data. For more information, see 
“Generating Enterprise Decision Management Output” on page 731.
Key 
Effective 
Date
Enables change tracking in intersection tables. For more information, see 
“Tracking Changes in Source Datetime Values” on page 544.
Lookup
Loads a target with columns taken from a source and from several lookup tables. 
For more information, see “Loading a Fact Table Using Dimension Table 
Lookup” on page 535.
Mining 
Results
Integrates a SAS Enterprise Miner model into a SAS Data Integration Studio 
data warehouse. Typically used to create target tables from a SAS Enterprise 
Miner model. For more information, see “Integrating a SAS Enterprise Miner 
Model with Existing SAS Data” on page 680.
Rank
Ranks one or more numeric column variables in the source and stores the ranks 
in the target. For more information, see “Create a Table That Ranks the Contents 
of a Source” on page 701.
SCD Type 
1 Loader
Enables you to load a dimension table using type 1 updates. Type 1 updates 
insert new rows, update existing rows, and generate surrogate key values in a 
dimension table without maintaining a history of data changes. Each business 
key is represented by a single row in the dimension table. For more information, 
see “Loading a Dimension Table with Type 1 Updates” on page 518.
Working with Transformations
37
Batch pdf to jpg converter online - Convert PDF to JPEG images in C#.net, ASP.NET MVC, WinForms, WPF project
How to convert PDF to JPEG using C#.NET PDF to JPEG conversion / converter library control SDK
convert .pdf to .jpg; convert pdf to jpg
Batch pdf to jpg converter online - VB.NET PDF Convert to Jpeg SDK: Convert PDF to JPEG images in vb.net, ASP.NET MVC, WinForms, WPF project
Online Tutorial for PDF to JPEG (JPG) Conversion in VB.NET Image Application
bulk pdf to jpg converter; convert pdf pages to jpg online
Name
Description
SCD Type 
2 Loader
Loads source data into a dimension table, detects changes between source and 
target rows, updates change tracking columns, and applies generated key values. 
This transformation implements slowly changing dimensions. For more 
information, see “Loading a Dimension Table with Type 1 and 2 Updates” on 
page 525.
Sort
Reads data from a source, sorts it, and writes the sorted data to a target. For more 
information, see “Creating a Table That Contains the Sorted Contents of a 
Source” on page 430.
Splitter
Selects multiple sets of rows from one source and writes each set of rows to a 
different target. Typically used to create two or more subsets of a source. Can 
also be used to create two or more copies of a source. For more information, see 
“Create Two Tables That Are Subsets of a Source” on page 704.
Standardize
Creates an output table that contains data standardized to a particular number. 
For more information, see “Creating Standardized Statistics from Table Data” on 
page 712.
Surrogate 
Key 
Generator
Loads a target, adds generated whole number values to a surrogate key column, 
and sorts and saves the source based on the values in the business key column or 
columns. For more information, see “Loading a Table and Adding a Surrogate 
Primary Key” on page 541.
Transpose
Creates an output table that contains transposed data. For more information, see 
“Creating Transposed Data from Table Data” on page 716.
User 
Written 
Code
Retrieves a user-written transformation. Can be inserted between existing 
transformations and removed later without affecting the mappings in the original 
process flow. Can also be used to document the process flow for the 
transformation so that you can view and analyze the metadata for a user-written 
transformation, similarly to how you can analyze metadata for other 
transformations. For more information, see “Adding a User Written Code 
Transformation to a Job” on page 266.
Data Quality Folder
The following table describes the transformations in the Data Quality folder in the 
Transformations tree. In general, you can use Apply Lookup Standardization, Create 
Match Code, and Standardize with Definition for data cleansing operations. You can use 
DataFlux Batch Job and DataFlux Data Service to perform tasks that are a specialty of 
DataFlux software, such as profiling, monitoring, or address verification.
Name
Description
Apply Lookup 
Standardization
Enables you to select and apply DataFlux schemes that standardize the 
format, casing, and spelling of character columns in a source table. For more 
information, see “Standardizing Values with a Standardization Scheme” on 
page 331.
38
Chapter 2 2 • • Getting Started
JPEG to PDF Converter | Convert JPEG to PDF, Convert PDF to JPEG
software; Support a batch conversion of JPG to PDF with amazingly high speed; Get a compressed PDF file after conversion; Support
changing file from pdf to jpg; conversion pdf to jpg
JPG to GIF Converter | Convert JPEG to GIF, Convert GIF to JPG
Features and Benefits. High speed JPEG to GIF Converter, faster than other JPG Converters; file name when you convert the files in batch; Storing conversion
.net convert pdf to jpg; pdf to jpg converter
Name
Description
Create Match 
Code
Enables you to analyze source data and generate match codes based on 
common information shared by clusters of records. Comparing match codes 
instead of actual data enables you to identify records that are in fact the same 
entity, despite minor variations in the data. For more information, see 
“Using Match Codes to Improve Record Matching” on page 337.
DataFlux Batch 
Job
Enables you to select and execute a DataFlux job that is stored on a 
DataFlux Data Management Server. You can execute DataFlux Data 
Management Studio data jobs, process jobs, and profiles. You can also 
execute Architect jobs that were created with DataFlux® dfPower® Studio. 
For more information, see “Using a DataFlux Job or Profile in a SAS Data 
Integration Studio Job” on page 345.
DataFlux Data 
Service
Enables you to select and execute a data job that has been configured as a 
real-time service and deployed to a DataFlux Data Management Server. For 
more information, see “Using a DataFlux Data Service in a SAS Data 
Integration Studio Job” on page 341.
Standardize 
with Definition
Enables you to select and apply DataFlux standardization definitions to 
elements within a text string. For example, you might want to change all 
instances of “Mister” to “Mr.” but only when “Mister” is used as a 
salutation. For more information, see “Standardizing Values with a 
Definition” on page 336.
Hadoop Folder
The following table describes the transformations in the Hadoop folder in the 
Transformations tree. Apache Hadoop is an open-source software project that supports 
scalable, distributed computing.
Name
Description
Hadoop 
Container
Enables you to connect all the sources and targets for the various steps in a 
container step. This container step allows for one connection to the Hadoop 
Cluster in the context of a SAS Data Integration Studio job. Then, all of the 
steps that are included in the container are submitted during the connection. 
For more information, see “Creating a Hadoop Container Job” on page 582.
Hadoop File 
Reader
Supports reading files from the Hadoop Cluster into SAS in the context of a 
SAS Data Integration Studio job.
Hadoop File 
Writer
Supports writing files to the Hadoop Cluster and into SAS in the context of a 
SAS Data Integration Studio job.
Hive
Supports submitting Hive code to the Hadoop Cluster in the context of a 
SAS Data Integration Studio job. Hive is a data warehouse system for 
Hadoop. You can easily summarize data, run ad hoc queries, and generate 
the analysis of large data sets stored in Hadoop compatible file systems. 
Hive also enables you to project structure onto this data and query the data 
by using an SQL-like language called HiveQL. For more information, see 
“Creating a Hive Job” on page 579.
Working with Transformations
39
JPG to DICOM Converter | Convert JPEG to DICOM, Convert DICOM to
Open JPEG to DICOM Converter first; Load JPG images from local folders in "File" in toolbar Windows Explorer; Select "Batch Conversion" & Choose "DICOM" in
change pdf to jpg file; change from pdf to jpg
JPG to JBIG2 Converter | Convert JPEG to JBIG2, Convert JBIG2 to
Open JPEG to JBIG2 Converter first; Load JPG images from local folders in "File" in toolbar Windows Explorer; Select "Batch Conversion" & Choose "JBIG2" in
convert pdf into jpg online; convert multiple pdf to jpg
Name
Description
Map Reduce
Supports submitting Map Reduce code to the Hadoop Cluster in the context 
of a SAS Data Integration Studio job. Hadoop Map Reduce enables you to 
write applications that reliably process vast amounts of data in parallel on 
large clusters. A Map Reduce job or step splits the input data-set into chunks 
that are processed by the map tasks in parallel. The outputs of the maps are 
sorted and then input to the reduce tasks. The input and the output of the job 
are typically stored in a file system. For an example of Map Reduce 
processing in a Hadoop container job, see “Creating a Hadoop Container 
Job” on page 582.
Pig
Supports submitting Pig code to the Hadoop Cluster in the context of a SAS 
Data Integration Studio job. The transformation contains an enhanced, color-
coded editor specific to the Pig Latin language. Pig Latin is a high-level 
language used for expressing and evaluating data analysis programs. Pig 
Latin supports substantial parallelization and can handle very large data sets. 
For more information, see “Creating a Pig Job” on page 575.
Transfer From 
Hadoop
Supports the transfer of data from the Hadoop Cluster in the context of a 
SAS Data Integration Studio job.
Transfer To 
Hadoop
Supports the transfer of data to the Hadoop Cluster in the context of a SAS 
Data Integration Studio job.
Output Folder
The following table describes the transformations in the Output folder in the 
Transformations tree.
Table 2.9 Output Folder Transformations
Name
Description
List Data
Creates an HTML report that contains selected columns from a source table. For 
more information, see “Creating Reports from Table Data” on page 695.
Publish Folder
The following table describes the transformations in the Publish folder in the 
Transformations tree.
Table 2.10 Publish Folder Transformations
Name
Description
Publish to 
Archive
Creates an HTML report and an archive of the report. For more information, see 
“Creating a Publish to Archive Report from Table Data” on page 662.
40
Chapter 2 2 • • Getting Started
JPG to JPEG2000 Converter | Convert JPEG to JPEG2000, Convert
Open JPEG to JPEG2000 Converter first; ad JPG images from local folders in "File" in toolbar Windows Explorer; Select "Batch Conversion" & Choose "JPEG2000" in
change file from pdf to jpg; convert pdf picture to jpg
JPG to Word Converter | Convert JPEG to Word, Convert Word to JPG
Open JPEG to Word Converter first; Load JPG images from local folders in "File" in toolbar Windows Explorer; Select "Batch Conversion" & Choose "Word" in
.pdf to .jpg online; best pdf to jpg converter online
Name
Description
Publish to 
Email
Creates an HTML report and e-mails it to a designated address. For more 
information, see “Creating a Publish to Email Report from Table Data” on page 
673.
Publish to 
Queue
Creates an HTML report and publishes it to a queue using MQSeries. For more 
information, see “Creating a Publish to Queue Report from Table Data” on page 
686.
SPD Server Dynamic Cluster Folder
The following table describes the transformations in the SPD Server Dynamic Cluster 
folder in the Transformations tree.
Table 2.11 SPD Server Dynamic Cluster Folder Transformations
Name
Description
Create or 
Add to a 
Cluster
Creates or updates an SPD Server cluster table. For more information, see 
“Creating an SPD Server Cluster Table” on page 568.
List Cluster 
Contents
Lists the contents of an SPD Server cluster table. For more information, see 
“Maintaining an SPD Server Cluster” on page 569.
Remove 
Cluster 
Definition
Deletes an SPD Server cluster table. For more information, see “Maintaining an 
SPD Server Cluster” on page 569.
SQL Folder
The following table describes the transformations in the SQL folder in the 
Transformations tree. For more information, see “Working with SQL Join 
Transformations” on page 435 and “Working with Other SQL Transformations” on 
page 481.
Table 2.12 SQL Folder Transformations
Name
Description
Create 
Table
Provides a simple SQL interface for creating tables.
Delete
Generates a PROC SQL statement that deletes user-selected rows in a single 
target table. Supports delete, truncate, or delete with a WHERE clause. Also 
supports implicit and explicit pass-through.
Execute
Enables you to specify custom SQL code to be executed and provides SQL 
templates for supported databases.
Working with Transformations
41
JPG to PNG Converter | Convert JPEG to PNG, Convert PNG to JPG
Open JPEG to PNG Converter first; Load JPG images from local folders in "File" in toolbar Windows Explorer; Select "Batch Conversion" & Choose "PNG" in "Output
convert multiple pdf to jpg online; change pdf to jpg format
VB.NET Image: PDF to Image Converter, Convert Batch PDF Pages to
RasterEdge .NET Imaging PDF Converter makes it non-professional end users to convert PDF and PDF/A documents commonly in daily life (like tiff, jpg, png, bitmap
best way to convert pdf to jpg; best convert pdf to jpg
Name
Description
Extract
Selects multiple sets of rows from a source and writes those rows to a target. 
Typically used to create one subset from a source. Can also be used to create 
columns in a target that are derived from columns in a source. For more 
information, see “Extracting Data from a Source Table” on page 692.
Insert Rows
Provides a simple SQL interface for inserting rows into a target table. For more 
information, see “Inserting Rows into a Target Table” on page 483.
Join
Selects multiple sets of rows from one or more sources and writes each set of 
rows to a single target. Typically used to merge two or more sources into one 
target. Can also be used to merge two or more copies of a single source. For 
more information, see “Creating a Simple SQL Query” on page 449.
Merge
Inserts new rows and updates existing rows using the SQL Merge DML 
command. The command was officially introduced in the SQL:2008 standard.
Set 
Operators
Enables you to use set operators to combine the results of table-based queries. 
For more information, see “Using the SQL Set Operators Transformation” on 
page 487.
Update
Updates user-selected columns in a single target table. The target columns can be 
updated by case, constant, expression, or subquery. Handles correlated 
subqueries.
Note: Some functions in the Delete, Execute, Insert Rows, Merge, and Update 
transformations might work only when the table comes from a database management 
system that provides an implementation of an SQL command for which a 
SAS/ACCESS interface is available. One example is sort. You can use SAS tables 
and tables from database management systems that do not implement the SQL 
command, but these command-specific functions might not work.
Ungrouped Folder
The Ungrouped folder contains any transformations that have been created with the 
Transformation Generator wizard and not assigned to a transformation category. The 
folder is displayed only when a generated transformation is present. It is displayed only 
to other users when the generated transformations are placed in the Shared Data folder.
Working with Stored Processes
Overview
You can create two types of stored processes in SAS Data Integration Studio:
• Version 1.0 stored processes, which are the IOM Direct Interface Stored Processes 
that were introduced in SAS 8. 
• Version 2.0 stored processes, which are the SAS Stored Processes that were 
introduced in SAS 9. 
42
Chapter 2 2 • • Getting Started
The following table compares the compatibility and features available in the two 
versions of stored processes.
Table 2.13 Stored Process Feature Comparison
Version 1.0
Version 2.0
Compatible with server versions prior to SAS 
9.3 and SAS 9.3 or later servers.
Compatible with SAS 9.3 or later servers 
only.
Associated with a specific logical server, 
which can be a SAS Stored Process Server or 
a SAS Workspace Server.
Associated with an application server context, 
and can be run by either a SAS Stored Process 
Server or a SAS Workspace Server. You can 
choose whether to restrict the server type or 
let the client application make the server 
selection.
Stores source code on the application server.
Stores source code either on the application 
server or in metadata.
Allows execution on the specified application 
server only.
Allows execution on other application servers 
or on the specified application server only.
Requires the *ProcessBody; comment if they 
are running on a workspace server.
Does not require the *ProcessBody; comment, 
regardless of which server is used.
Must use the stored process server to produce 
streaming output.
Uses either the stored process server or the 
workspace server to produce streaming output.
Data sources and targets can be generic 
streams or XML streams.
Data sources and targets can be generic 
streams, XML streams, or data tables.
You can perform the following tasks with stored processes:
• “View the Version Number for a Stored Process” on page 43
• “Deploy a Job as a Version 1.0 or Version 2.0 Stored Process” on page 44
• “Create a Version 2.0 Stored Process” on page 44
• “Convert a Stored Process from One Version to Another” on page 45
View the Version Number for a Stored Process
To view the version number for an existing stored process, perform the following steps:
1. From the desktop, verify that the View 
ð
Basic Properties option is selected. 
2. Navigate to a folder that contains stored processes. 
3. Select a stored process. You can then view the version number in the Basic 
Properties pane, as shown in the following figure. 
Working with Stored Processes
43
Display 2.3 Basic Properties for a Stored Process
Deploy a Job as a Version 1.0 or Version 2.0 Stored Process
You can deploy an existing job as a version 1.0 or version 2.0 stored process. For 
information, see the stored process topics in “Deploying Jobs as Stored Processes” on 
page 230.
Create a Version 2.0 Stored Process
To create a new version 2.0 stored process that is not based on a SAS Data Integration 
Studio job, right-click a folder in the Folders tree and select Stored Process from the 
New menu. You can also select Stored Process in the New item on the toolbar. Either 
method displays the New Stored Process wizard.
For detailed information about creating a stored process, navigate to the Execution page 
of the wizard. Then, click Manage to display the Manage Source Code Repositories 
window. Finally, click Help. Open the Stored Process Management folder to review 
the available topics.
44
Chapter 2 2 • • Getting Started
Convert a Stored Process from One Version to Another
You can convert a stored process from one version to another. For example, you might 
deploy a job as a version 1.0 stored process, but later you might want to take advantage 
of the version 2.0 features. In that case, you can deploy the job as a version 1.0 stored 
process. Then, you can upgrade that stored process to version 2.0 and access the new 
features.
To convert a version 1.0 stored process to version 2.0, right-click the stored process and 
select Upgrade. You can verify that the version number in the Usage Version field in 
the Basic Properties pane has been changed to 2.0. You can open the Properties window 
of the upgraded stored process and enable the 2.0 features on the Execution tab.
You might also want to convert a version 2.0 stored process to a version 1.0 stored 
process in order to run it on an older server (a server with a version prior to SAS 9.3). To 
convert a version 2.0 stored process, select the stored process. Open the Properties 
window to verify that no features that are unique to version 2.0 are being used. Then, 
right-click the stored process and select Make Compatible. If the stored process runs on 
a SAS Workspace server, make sure that the *ProcessBody; comment is included in the 
source code. You can verify that the version number in the Usage Version field in the 
Basic Properties pane has been changed to 1.0.
Working with Web Services
You can use a web service client to execute SAS Data Integration Studio jobs. For more 
information, see the web service topics in “Deploying Jobs” on page 220. You can use 
SAS Data Integration Studio jobs to call third-party web services. For more information, 
see the SOAP and REST topics in Appendix 3, “Miscellaneous Transformations,” on 
page 653.
Specifying Global Options in SAS Data 
Integration Studio
Problem
You want to set default options for SAS Data Integration Studio.
Solution
Specify the appropriate option in the start command for SAS Data Integration Studio, or 
specify an option in the global Options window, as described in the following topics:
• “Starting SAS Data Integration Studio” on page 20
• “Use the Global Options Window” on page 46
Specifying Global Options in SAS Data Integration Studio
45
Tasks
Use the Global Options Window
To display the global Options window from the SAS Data Integration Studio desktop, 
select Tools 
ð
Options from the menu bar.
From the Options window, you can specify options such as the following:
• general interface options for SAS Data Integration Studio
• options for the Diagram tab of the Job Editor window
• options for the Code tab of the Job Editor window
• options for the default SAS Application Server for SAS Data Integration Studio
• options for the View Data window
• options which specify how SAS Data Integration Studio generates code
• data quality options, such as options for the Create Match Codes transformation and 
the Apply Lookup Standardization transformation
Working with Change Management
Problem
A team of SAS Data Integration Studio users wants to work simultaneously with a set of 
related metadata. They want to avoid overwriting each other's changes.
Solution
Have an administrator set up a change-managed folder in the Folders tree, such as the 
Data Collection 2 (CM) folder shown in the following display.
Display 2.4 Data Collection 2 (CM) Folder Is under Change Management
Under change management, most users are restricted from adding or updating the 
metadata in a change-managed folder in the Folders tree. Authorized users, however, can 
add new metadata objects and check them in to the change-managed folder. They can 
also check out metadata objects from the change-managed folder in order to update 
them. The objects are locked so that no one else can update them as long as the objects 
46
Chapter 2 2 • • Getting Started
Documents you may be interested
Documents you may be interested