c# pdf parser free : Add metadata to pdf file Library SDK component .net asp.net windows mvc WUSS-How-to-Easily-Convert-Clinical-Data-to-CDISC-SDTM0-part781

H
OW TO EASILY CONVERT CLINICAL DATA TO 
CDISC
SDTM
Ale Gicqueau, Clinovo, Sunnyvale CA 
WUSS 2011  
Annual Conference October 2011 
Add metadata to pdf file - add, remove, update PDF metadata in C#.net, ASP.NET, MVC, Ajax, WinForms, WPF
Allow C# Developers to Read, Add, Edit, Update and Delete PDF Metadata
acrobat pdf additional metadata; embed metadata in pdf
Add metadata to pdf file - VB.NET PDF metadata library: add, remove, update PDF metadata in vb.net, ASP.NET, MVC, Ajax, WinForms, WPF
Enable VB.NET Users to Read, Write, Edit, Delete and Update PDF Document Metadata
clean pdf metadata; c# read pdf metadata
How to easily convert clinical data to CDISC SDTM 
Page 2 of 12 
Proprietary and Confidential 
T
ABLE OF 
C
ONTENTS
1.
I
NTRODUCTION
.................................................................................................................... 3
2.
CDISC
E
XPRESS 
A
PPLICATION
................................................................................................. 4
3.
C
ONCLUSION
..................................................................................................................... 12
4.
A
CKNOWLEDGMENTS
.......................................................................................................... 12
C# PDF Password Library: add, remove, edit PDF file password in C#
This example shows how to add PDF file password with access permission setting. passwordSetting.IsAssemble = true; // Add password to PDF file.
search pdf metadata; pdf metadata
VB.NET PDF File Compress Library: Compress reduce PDF size in vb.
Document and metadata. All object data. File attachment. Flatten visible layers. VB.NET Demo Code to Optimize An Exist PDF File in Visual C#.NET Project.
batch pdf metadata; analyze pdf metadata
How to easily convert clinical data to CDISC SDTM 
Page 3 of 12 
Proprietary and Confidential 
1.
I
NTRODUCTION
Sponsors are receiving clinical information of increased complexity, from multiple sources and different 
formats.  As a result, clinical data submission has become more time-consuming, costly and error-prone.  
To tackle this challenge, CDISC® (Clinical Data Interchange Standards Consortium) has been establishing 
new non-proprietary clinical data standards to speed up data-review and improve clinical data exchange, 
storage and archival.  Conforming to these recognized CDISC standards improves and significantly speeds 
up FDA submission and FDA review.  In addition, converting clinical data to a standardized format will 
improve SAS code re-usability for many programs used in data management and biostatistics such as Edit 
Checks, Patient Profile, TLGs, and custom reports. 
SAS is often used as an ETL tool to manually convert SAS extracts from a clinical database to SDTM format.  
While this is a reasonable approach, it can quickly become tedious, error-prone, and time consuming.  
CDISC Express is a powerful open source SAS®-based clinical data management system that automatically 
and systematically converts clinical data into CDISC SDTM using an Excel framework.  All CDISC Express 
mapping definitions and rules are defined in Excel, which are dynamically converted into a SAS program 
that automatically performs the SDTM transformation and validation through a series of SAS macros  
CDISC Express source code is freely available, well-documented and easily understandable; it can be easily 
modified by any SAS programmer to fit his company SAS infrastructure. 
This paper will provide SAS programmers with an introduction to CDISC Express, and show how the SAS 
programs and configuration files are organized.  We will also show how to create macros, and convert 
clinical data to CDISC SDTM domains. 
C# PDF File Compress Library: Compress reduce PDF size in C#.net
Document and metadata. All object data. Flatten visible layers. C#.NET DLLs: Compress PDF Document. Add necessary references: RasterEdge.Imaging.Basic.dll.
pdf metadata editor; pdf metadata viewer
VB.NET PDF insert image library: insert images into PDF in vb.net
using RasterEdge.XDoc.PDF; Have a try with this sample VB.NET code to add an image to the first page of PDF file. ' Open a document.
bulk edit pdf metadata; read pdf metadata
How to easily convert clinical data to CDISC SDTM 
Page 4 of 12 
Proprietary and Confidential 
2.
CDISC
E
XPRESS 
A
PPLICATION
How to convert easily Clinical Data to CDISC SDTM domains 
We are describing below the seven key steps used to convert clinical data to CDISC SDTM using CDISC 
Express: 
I)
Download and install CDISC Express to your computer 
II)
Create a new study folder (if needed) 
III)
Create a new mapping file template (if needed) 
IV)
Modify Mapping Files ͚tmpmapping.xls͛ 
V)
Validate Mapping File ͚tmpmapping.xls͛ 
VI)
Generate CDISC SDTM domains 
VII)
Generate define.xml file 
I)
Download and install CDISC Express 
Prerequisites:  
1.
Windows XP 
2.
SAS version 9.1.3 or 9.2 
3.
Excel 2002 or above 
4.
Around 60 mb available on the hard drive for the installation 
5.
Internet Explorer preferred, as our web pages are best viewed in that browser. 
Download and Install CDISC Express: 
1.
Visit http://www.clinovo.com/cdisc/download,  
2.
An email with a download link will be sent to the mailbox you provided in the short form 
3.
Follow the download link provided in the email and install CDISC Express on your computer 
4.
Save ͚ linovo_ DIS _Express.exe͛ to your hard drive 
5.
Double click ͚ linovo_ DIS _Express.exe͛ to start the installation wizard 
6.
lick ͚Run͛ when prompted to execute ͚ linovo_ DIS _Express.exe͛  
7.
lick ͚Next>͛ from the ͚Welcome to the  linovo  DIS  Express v1.0 Setup Wizard͛ 
8.
heck the box for ͚I accept the terms of the License Agreement͛ and click ͚Next>͛ to 
continue. 
9.
Choose a destination folder, such as ͚ :\Program Files\ DIS  Express͛ and click ͚Install͛ to 
continue 
10.
Once the installation is complete, click ͚Finish͛ to exist the installation wizard. 
y selecting ͞Launch͟ from the Welcome menu, you can see how  DIS  Express program and 
configuration files are organized (Figure 1).   
C# PDF File Merge Library: Merge, append PDF files in C#.net, ASP.
Add necessary references: using RasterEdge.XDoc.PDF; Note: When you get the error "Could not load file or assembly 'RasterEdge.Imaging.Basic' or any other
pdf metadata editor online; view pdf metadata in explorer
VB.NET PDF File Split Library: Split, seperate PDF into multiple
1). ' Create output PDF file path list Dim outputFilePaths As New List(Of String) Dim i As Integer For i = 0 To splitIndex.Length outputFilePaths.Add(Program
remove metadata from pdf; modify pdf metadata
How to easily convert clinical data to CDISC SDTM 
Page 5 of 12 
Proprietary and Confidential 
Figure 1. CDISC Express folder structure 
welcome – This shortcut displays the Welcome dashboard with useful links. 
documentation – This folder contains useful documentation: a Quick Start Guide, a User Guide, 
and FAQ, a Video Tutorial, an the User Agreement. 
macros – This folder contains all the macros. 
macros\ClinMap – This folder contains all the macros used by the core of the application. 
macros\function_library – This folder contains macros to map your data to SDTM domains. 
programs – This folder contains all the SAS programs that you can use with your studies. 
SDTM Validation – This folder is used to validate the SDTM domains. 
specs – This folder contains all the specification like SDTM terminology and LAB specs. 
studies – This folder contains all studies you want to map.   
temp – This folder contains a newly generated tmpmapping.xls file after executing 
͚generate_mapping_template.sas͛ file. 
II)
Create a new study folder (if needed): 
1.
Run ͚create_new_study.sas͛ to create a new study folder with a specified study name.  Once 
the study folder is created, it will create all the folder structure within the new study folder 
located at \CDISC Express\studies\<New Study Name>  
III)
Create a new mapping file template (if needed): 
1.
Once a new study folder is created, users can create a new mapping file with specified 
domain  by  running  ͚generate_mapping_template.sas͛  to  create  a  new  mapping  file 
͚tmpmapping.xls͛  in  the  folder  \CDISC  Express\temp  folder  with  4  default  sheets  – 
Studymetadata, Format, DM, and SUPPQUAL. 
2.
Run % reatemapping.sas if a domain other than ͚DM͛ is needed.  Users will have an option 
to choose whether they like to have ͚Required,͛ ͚Expected,͛ and \or ͚Permissible͛  DIS  
SDTM variables by adjusting the parameters for ͚ reatemapping͛ macro. 
IV)
Modify the sample mapping file ‘tmpmapping.xls 
The mapping file (Figure 2) is the heart of the system and contains all the mapping rules for the 
CDISC® variables.  It is saved in the 'DOC' folder of the corresponding study.  There are two sub 
folders: 
'Mapping file - working version' folder: This folder contains the working version of the 
mapping file (tmpmapping.xls).  Any changes to the mapping rules should be done in this 
document. 
VB.NET PDF File Merge Library: Merge, append PDF files in vb.net
by directly tagging the second PDF file to the target one, this PDF file merge function VB.NET Project: DLLs for Merging PDF Documents. Add necessary references
endnote pdf metadata; remove pdf metadata online
C# PDF Library SDK to view, edit, convert, process PDF file for C#
PDF SDK for .NET allows you to read, add, edit, update, and delete PDF file metadata, like Title, Subject, Author, Creator, Producer, Keywords, etc.
online pdf metadata viewer; pdf keywords metadata
How to easily convert clinical data to CDISC SDTM 
Page 6 of 12 
Proprietary and Confidential 
'Mapping file - validated version' folder: CDISC® Express has a program to validate the 
mapping rules in ͚tmpmapping.xls.͛   After creating or updating the ͚tmpmapping.xls͛ file in 
the ͚Mapping file - working version͛ folder, a SAS program will validate the document by 
checking the syntax. If no issues are detected, the working file will be copied to the folder 
'Mapping file - validated version'. It is important not to change this file. Only the working 
version of the mapping file should be updated by the users. 
In this section, the user makes his necessary modifications to the ͚tmpmapping.xls͛ file in the 
͚Mapping file - working version͛ folder. The validation of the tmpmapping.xls file will be done 
after the modification of this mapping file is complete. This mapping file is an Excel file in XML 
format with the following types of sheets:  
͚StudyMetadata͛ tab 
͚FORMAT͛ tab 
͚Domain͛ tabs (EM, EX, IE…etc) 
͚SUPPQUAL͛ tab 
Figure 2. Mapping file structure  
a)
͚StudyMetadata͛ tab 
The Studymetadata tab (Figure 3) contains the information to generate the Define.xml 
file. Information about the XML elements is present in the columns ͚XMLField͛ and 
͚XMLElement.͛ You can update the ͚Values͛ column to represent your study details. The 
column ͚ omments͛ has some additional information to help you with understand each 
row of the ͚StudyMetadata͛ tab. 
Figure 3. StudyMetadata tab of the mapping file 
How to easily convert clinical data to CDISC SDTM 
Page 7 of 12 
Proprietary and Confidential 
b)
͚FORMAT͛ tab 
All SAS formats can be used in the mapping file.  You can also define custom formats and 
specify them in the FORMAT tab (Figure 4).   
The FORMAT tab contains 3 columns: 
format – Defines the format name.  It has to start with a $ sign for a text format 
and cannot contain blanks.  Numeric formats do not need the $ sign. 
from – Defines the entry value that you want to apply the format to. 
tovalue – Defines the value that will replace the entry value. 
For example, the first format is $sev.  If you apply this format to a variable, the value ͚1͛ 
will be replaced by ͚MILD. 
Figure 4. FORMAT tab of the mapping file 
c)
͚Domain͛ tabs (DM, TV, SV, AE,  M, MH, EX, VS, DS, LB, SC, IE, TI, CO..etc) 
Each SDTM domain that will be mapped has to have its own tab.  The name of the tab 
defines the SDTM domains that is created by the instructions contained in the tab. 
A domain tab contains 6 columns (Figure 5).  Users need to modify these columns in 
each domain tab to suit their clinical studies. 
Dataset – Specifies the source datasets that will be operated on, to create the 
STDM domains as defined by the name of the tab.     
Merge Key – Defines the variables that will be used to merge the datasets that 
are specified in the Dataset column. If this column is not empty, the application 
assumes that the variable USUBJID is to be used to merge.   
Join (optional) – Specifies whether an IN option should be employed in merging 
the datasets with a merge key.   
CDISC variable – Specifies the CDISC variables that will be created.   
Expression – Provides the detail on the assignment statement of the SDTM 
variable in the CDISC variable column.   The expressions are to create the CDISC 
variables from the source datasets.  Users fill this column out with the help of 
studty protocol and the structure of the source datasets.  The SAS macros from 
the function library can be used, and this library can be further extended based 
on the requirements for the clinical study. 
How to easily convert clinical data to CDISC SDTM 
Page 8 of 12 
Proprietary and Confidential 
Comments – It is for documentation purpose and will appear in the column 
'comment' of the define.xml of the study.   
Explanation – It provides additional details and explanation to help you with 
creating the mapping file for your study. It is not used by the CDISC® Express 
application. 
Figure 5. Domain tab of the mapping file 
Note that if you do not want to process a domain, you can add '-' before the tab name 
(Figure 6).  The domains with a name starting by '-' are excluded from the mapping 
validation and the SDTM generation programs.  
Figure 6. Excluded TV, SC, and AE domains with ‘-‘ prefix 
d)
͚SUPPQUAL͛ tab 
The ͞SUPPQUAL͛ tab defines the non-standard variables to be created that cannot be 
mapped to already defined SDTM variables.  Because the CDISC SDTM does not allow 
the addition of new variables, it is necessary to represent the metadata and data for 
each non-standard variable/value combination in the SUPPQUAL dataset.  Users need to 
fully define the metadata of the SUPPQUAL variables which include Domain Name, 
Variable Name, Variable Label, Type, Length, and Origin.  The description of these 6 
variables is as below: 
Domain – SDTM domain name. 
VariableName – Variable name which has to be uppercase. 
VariableLabel – Variable label. 
Type – Variable type which can be either Char or Num. 
Len – Variable Length. 
Origin – Variable origin which can be CRF or MACRO. 
Note:  
1)
All data values are stored as characters, so that the type will always be a character, even 
if a numeric value is specified.         
2)
The length of the variable must be correctly specified to ensure no values are truncated.   
How to easily convert clinical data to CDISC SDTM 
Page 9 of 12 
Proprietary and Confidential 
3)
The SUPPQUAL datasets are created for each domain, e.g. SUPPDM.  These datasets may 
be transposed and merged back with the domain dataset, e.g. DM.   
4)
To distinguish SUPPQUAL variables from the Domain variables, the SUPPQUAL variables 
are prefixed with ͚~͛ in the Domain definition. 
V)
Validate the mapping file ‘tmpmapping.xls’ 
Once the working version of the mapping file ͚tmpmapping.xls͛ is completely filled, the file has to 
be checked for logical and syntactical errors by running the program, Validate_Mapping_File.sas,͛ 
before comforting the data to SDTM.  This SAS program will check whether the tmpmapping.xls 
meets requirements.   
A message will be displayed on the HTML page indicating the validation is successful.  The 
temporary mapping  file  will  be renamed  as ͚mapping.xls͛ and  saved  in the folder \CDISC 
Express\Studies\my study\doc\Mapping file - validated version folder, and the previous validated 
mapping file will be archived by adding the current date and time to the file name and stored in 
the same folder. 
If  the  validation  fails,  a  list  of  error  messages  will  be  displayed  in  the  HTML  page 
͚mapping_validation.html͛ 
located  in 
the 
folder 
\CDISC  Express\Studies\my 
study\results\Mapping Validation.  After reading the error message, user will correct errors in the 
mapping file and then validate it again until all errors are cleared. 
As errors may occur in several domains, to be more efficient and focused, it is possible to 
comment  out  unnecessary  domains  by  prefixing  the  sheet  name  with  a  dash  in  the 
͚tmpmapping,xls͛ file as below.  However, a domain should not be commented if certain 
expressions require variables from other domains. 
Below is the list of error handling codes that have been built into CDISC Express (\CDISC 
Express\specs\Mapping validation\validation_err.xls) with five error categories (Figure 7). 
Mapping file – Rules to check the mapping file structure 
FORMAT Tab – Rules to check the data entered on the FORMAT tab. 
CDISC mapping definition – Rules to check the mapping expression for the 
different domains 
SUPPQUAL domain – Rules for the SUPPQUAL domain 
CO domain – Rules for the CO domain 
This spreadsheet is used by the validation program to interpret error codes with variable names, 
domain names, and/or type of errors.  This list of error can be extended by adding new error 
codes and definitions.  Once a new definition is added, the macro ͚validatestudy.sas͛ should also 
be updated to test the mapping file for the presence of these new errors. 
How to easily convert clinical data to CDISC SDTM 
Page 10 of 12 
Proprietary and Confidential 
Figure 7. Error handling codes table 
VI)
Generate CDISC SDTM domains 
Once the validation of the mapping file is successful, we can create CDISC SDTM domains by 
running ͚generate_SDTM.sas͛ from \CDISC Express\Programs folder.  This program will generate 
all the SDTM domains based on the specifications defined in the mapping.xls file.  The generated 
SDTM domains will reside in the \CIDSC Express\studies\<Study Name>\results\SDTM folder. 
Documents you may be interested
Documents you may be interested