how to export rdlc report to pdf without using reportviewer c# : Extract all text from pdf SDK control project wpf web page .net UWP FullEnterpriseArchitectureGuide0.15-part641

Key Systems Inventory
Summary
Maintained By Contact
Accessed Off 
Campus
Intended 
Availability
Charge for 
Service?
Primary User 
Base
Secondary 
User Base
Hardware 
Platform
Operating 
System
Database
Services used 
/Available
Other Key 
Technology
Hosting 
Location
Future Plans
SMS
Space 
Management 
System.  Allows
s
people to 
model 
scenarios.
Facilities
Mike Sherman
24 X 7
No
MIT 
Students/Facult
y/Staff
Oracle
Campus Map 
Service
W 91
PPL Keys
Manages the 
inventory of all 
keys on 
Campus.
Facilities
Mike Sherman
VAX
Ingress
W91
Practice Management 
System
This system is 
responsible for  
the operational 
aspects of the 
Medical Center.
Medical Dept. Alison Knott, 
Kin Lie
Yes
24 X 7 with a 
short down time
daily at 2am
No
Medical 
department and 
MIT Health 
employees
Dell
Windows 2000 Cache
Roles
IDX Application 
plus custom 
modules
E-23
Upgrading the 
to FlowCast, 
the latest 
generation of 
the IDX PMS 
system, with a 
web interface.  
In the process 
of making 
everything 
totally 
redundant 
within the 
health center.
Electronic Medical 
Records
An 
implementation 
of Allscripts‘ 
Touchworks 
product and is 
the central 
repository for 
all information 
pertaining to a 
patients 
medical record 
Medical Dept. Alison Knott, 
Kin Lie
Yes
24 X 7
No
Medical 
department and 
MIT Health 
employees
Dell
Windows 2000 SQL Server
Roles
TouchWorks by 
AllScripts
E-23
In the process 
of making 
everything 
totally 
redundant 
within the 
health center.
Patient Online
Patient On-Line 
is an online 
patient portal 
that is, at time 
of writing, 
limited in 
functionality.
Medical Dept. Alison Knott, 
Kin Lie
24 X 7
No
Patients 
Dell
Patient Online 
is a major 
ongoing 
initiative.
E-Scription
This system 
Medical Dept. Alison Knott, 
Kin Lie
24 X 7
No
Medical 
department and 
MIT Health 
employees
Dell
Page 51
Extract all text from pdf - extract text content from PDF file in C#.net, ASP.NET, MVC, Ajax, WinForms, WPF
Feel Free to Extract Text from PDF Page, Page Region or the Whole PDF File
extract text from pdf java open source; extract text from image pdf file
Extract all text from pdf - VB.NET PDF Text Extract Library: extract text content from PDF file in vb.net, ASP.NET, MVC, Ajax, WinForms, WPF
How to Extract Text from PDF with VB.NET Sample Codes in .NET Application
copy text from pdf to word with formatting; export highlighted text from pdf to word
Key Systems Inventory
Summary
Maintained By Contact
Accessed Off 
Campus
Intended 
Availability
Charge for 
Service?
Primary User 
Base
Secondary 
User Base
Hardware 
Platform
Operating 
System
Database
Services used 
/Available
Other Key 
Technology
Hosting 
Location
Future Plans
Corporate Database
e
ILP
Barton
Barton is a 
Library 
Management 
System and is 
essential to 
nearly all 
aspects of 
operation of the 
library at MIT.
Libraries
MacKenzie 
Smith
Yes
24 X 7
No
Barton Front 
End: All of MIT; 
Barton 
Business Back 
End: MIT Staff
Barton Front 
End: All of the 
general public
Sun E450
Sun Solaris
Oracle 
Kerberos, IS&T 
Gold Contract 
for 
Maintenance
14S
Enhancements 
to the web UI of 
Barton.  
EHSWeb
Tracks 
employee 
training needs 
and trainings 
attended for 
health and 
safety
EHS
Jim Repa
Yes
24 X 7 with a 
1/2 hr nightly 
backup
No
Anyone who 
needs to take 
training: 
Researchers/F
aculty/Students
, EHS Office, 
Admin/PI in 
DLC
Emergency 
Response 
People
Sun  
Sun Solaris
Oracle 
X509, Roles
W91
Migrate 
PI/SARA to 
SAP
Card System
m
Tech Cash
Parking System
m
Admissions Portal
Undergraduate 
Admissions
Graduate Admissions
MITSIS
the MIT 
Student 
Information 
System, is an 
administrative 
system that 
serves all of the 
student 
services at 
MIT.
Student 
Services
Kent Dorsey
Yes
24 x 7 with daily
downtime from 
3am to 6am
No
MIT 
Students/Facult
y/Staff
HP Alpha
OpenVMS
Oracle 7.3.4
SQL Forms 3.0 
and SQR, 
Oracle Forms 
applications 
and batch 
programs run 
here, ProC, C, 
COBOL 
programs also 
run here
W91
WebSIS
WebSIS, MIT's 
web-based 
Student 
Information 
System, 
provides 
students with 
full access to 
their financial 
and academic 
records.
Student 
Services
Kent Dorsey
Yes
24 x 7 with daily
downtime from 
3am to 6am
No
MIT Students, 
Faculty, Staff
HP Alpha
Tru64 Unix
Oracle 7.3.4
Netscape Web 
Server, SQR
W91
Page 52
C# PDF Image Extract Library: Select, copy, paste PDF images in C#
Able to extract vector images from PDF. Extract all images from whole PDF or a specified PDF page. C#: Extract All Images from PDF Document.
delete text from pdf online; find and replace text in pdf file
VB.NET PDF Image Extract Library: Select, copy, paste PDF images
Extract all images from whole PDF or a specified PDF page in VB.NET. using RasterEdge.XDoc.PDF; VB.NET: Extract All Images from PDF Document.
copy highlighted text from pdf; export text from pdf
Key Systems Inventory
Summary
Maintained By Contact
Accessed Off 
Campus
Intended 
Availability
Charge for 
Service?
Primary User 
Base
Secondary 
User Base
Hardware 
Platform
Operating 
System
Database
Services used 
/Available
Other Key 
Technology
Hosting 
Location
Future Plans
Advance
Sloan Admin DB
Holds the 
Alumni data for 
Sloan School 
Alumni
Sloan School of 
Management
Al Essa
No
Sloan Space
SloanSpace is 
a portal for the 
entire extended 
Sloan 
community.  
Sloan School of 
Management
Al Essa
Yes
24 x 7
No
MIT Students, 
Faculty, 
Alumni, Staff
Industry 
Sponsors, 
Researchers
Sun B 440
Sun Solaris
Oracle
AOL Web 
Server, Oracle 
Database 
Server
W91
Reach a point 
where DOT 
LEARN is a 
stand alone 
project so if 
Sloan left the 
project would 
still go on. 
Stellar
Stellar is a 
Learning 
Management 
System 
developed at 
MIT for 
managing the 
authoring and 
delivery of 
courses.
AMPS
Craig 
Counterman
Yes
24 x 7
No
MIT Students, 
Faculty, Staff
Sun
Sun Solaris
Oracle
Kerberos
Apache Web 
Server, Tomcat 
Application 
Server
W 91
OCW
Makes the 
course 
materials that 
are used in the 
teaching of 
almost all MIT’s 
undergraduate 
and graduate 
subjects 
available on the 
Web
OCW
Cec d'Oliveira Yes
24 x 7
No
Anyone
Windows 2000 
SQL Server 
2000
Sapient
DSpace
Provide long 
term storage 
options of 
digital products 
to MIT faculty 
and 
Researchers.
Libraries
MacKenzie 
Smith
Yes
24 x 7
No
MIT faculty and 
researchers
HP
Redhat Linux     PostgreSQL
X509
14S
Vera
Allows access 
to MIT Library 
resources from 
off campus
Libraries
MacKenzie 
Smith
Yes but only for 
the MIT 
Community
24 x 7
No
MIT 
Students/Facult
y/Staff
Sun
Sun Solaris
FileMaker
14S
Page 53
VB.NET PDF Page Extract Library: copy, paste, cut PDF pages in vb.
VB.NET: Extract All Images from PDF Document. This is an example that you can use it to extract all images from PDF document. ' Get page 3 from the document.
copy pdf text to word; c# extract pdf text
C# PDF Convert to Text SDK: Convert PDF to txt files in C#.net
DotNetNuke), SharePoint. All text content of target PDF document can be copied and pasted to .txt files by keeping original layout. C#.NET
copy text from pdf; edit pdf replace text
Key Systems Inventory
Summary
Maintained By Contact
Accessed Off 
Campus
Intended 
Availability
Charge for 
Service?
Primary User 
Base
Secondary 
User Base
Hardware 
Platform
Operating 
System
Database
Services used 
/Available
Other Key 
Technology
Hosting 
Location
Future Plans
EZProxy
Provides a way 
for libraries to 
extend web-
based licensed 
databases to 
their remote 
users.
Libraries
MacKenzie 
Smith
Yes
24 x 7
No
MIT 
Students/Facult
y/Staff
14S
SFX
SFX is a tool to 
help you link 
from an article 
citation in a 
database to the 
full text of that 
article.
Libraries
MacKenzie 
Smith
Yes
24 x 7
No
MIT 
Students/Facult
y/Staff
Page 54
C# PDF Form Data Read Library: extract form data from PDF in C#.
enable users abilities to read and extract PDF form data Able to retrieve all form fields from adobe PDF it should have functions for processing text, image as
cut text from pdf document; can't copy text from pdf
VB.NET PDF Form Data Read library: extract form data from PDF in
DLLs: Read and Extract Field Data in VB.NET. Demo Code to Retrieve All Form Fields from a PDF field Console.WriteLine(" Content: " + obj.Text) ElseIf TypeOf
export highlighted text from pdf; erase text from pdf
Page 
Prepared by Sapient for MIT
Version 0.1 – August – September 2004
This document represents a snapshot of an evolving set of documents.  For information on further iterations, please visit: http://istwiki.mit.edu/istwiki/ItagFrontPage
Athena Environment
Athena is a collection of systems that are developed and maintained by MIT to support the core IT infrastructure of the Institute.  They cover a number of service areas including 
authentication, authorization, network access, list management, remote file systems and more.  The main components of the Athena solution are:
• Kerberos is a network authentication protocol initially developed by MIT to provide strong authentication for network applications using secret-key cryptography.  The 
specification is now maintained by an industry body, but MIT continues to maintain and distribute an implementation of the protocol and use it internally as the primary 
authentication mechanism for enterprise applications.  It provides a single sign on capability through the issuing of tickets to an agent running on a user’s desktop; these 
tickets are then used to authenticate to a “Kerberized” application.  Kerberos is designed for use with traditional client/server applications.  MIT has extended authentication in 
to the web domain using a Certificate Authority, described later.
• Moira is primarily a list maintenance application.  It is the repository for several types of data used by other systems within the Athena environment as well as enterprise 
systems at MIT.  Moira is the authority for mapping MIT IDs (the primary form of electronic as well as physical identity token at MIT) to Kerberos principles that can be used 
for authentication.  It also manages a set of lists that are used to provide enterprise authorization information to applications.  Much of the data contained within the Moira 
database is fed periodically to the Data Warehouse for reporting and distribution.
• Hesiod provides a mechanism for discovering various types 
of information within the Athena environment.  It keeps track 
of post office servers, printers and machines.  For example 
Hesiod provides the ability for a user to determine which post 
office server currently has their email; clients capable of 
interacting with Hesiod can therefore seamlessly manage the 
movement of a user’s account between post office servers.
• AFS is an implementation of the Andrews File System.  This 
provides a remote file system capability for use by computers 
within the Athena environment.  It is used to store the home 
directories of users with Athena accounts and is the store for 
the web.mit.edu website.  It is Kerberos aware, and hence 
can apply permissions based upon the Kerberos identity of a 
given user.
• Zephyr is a presence and messaging service supported 
within the Athena environment.  When a user is logged on at 
an Athena workstation the system tracks this information 
centrally, and can route text messages between users logged 
on to the system.
• The Certificate Authority is a system for issuing X509 
certificates.  It can create certificates for identifying both web 
clients and servers.  The Certificate Authority allows the 
Kerberos authentication principle to be extended for use with 
web applications; a user can identify themselves to the 
Certificate Authority using their Kerberos principal.  Having 
authenticated themselves a Kerberos user can then create 
any number of certificates with validity periods of up to a 
year, for the purpose of authenticating themselves to web 
applications that use X509 certificates for authentication.  
This has the advantage of maintaining a single identity for 
systems using both Kerberos and X509, and therefore allows 
authorization and other types of information to be leveraged.
• The Domain Name Service takes information propagated 
from the Athena environment on a regular basis.  Athena 
manages the assignment of domain names to computers on 
campus, both within and beyond the Athena environment.  
This information is fed to the DNS servers on a regular basis 
in order that they convey accurate information to clients.
System
Component
Key:
Related
System
Other MIT
System
External
Systems
Client
WS
mit.edu
Moira
Kerberos
Hesiod
PO
Box
Zephyr
(IM)
AFS
(3) Sign On
(3) File Access
(1) Tickets
(2) /etc/passwd
(3) Check Mail
CA
Web
Register
Web
Data Storage
Data Storage
Data Storage
Data Storage
Mailman
Aliases
Data Storage
Update Data Flow
DNS
Name Service
Manual Check
Will Change
Data
Warehouse
Note: Moira is Authoritative for mapping of Kerberos ID to MIT ID
55
C# PDF - Extract Text from Scanned PDF Using OCR SDK
SharePoint. Recognize the whole PDF document and get all text content. Recognize a page of PDF document and extract its text content.
a pdf text extractor; copying text from pdf to word
C# PDF Text Search Library: search text inside PDF file in C#.net
1; int pageCount = 2 // Search text from second page SearchResult results = pdf.Search("RasterEdge", option, pageOffset Search specified string from all the
extract text from pdf file using java; extract text from pdf
Page 
Prepared by Sapient for MIT
Version 0.1 – August – September 2004
This document represents a snapshot of an evolving set of documents.  For information on further iterations, please visit: http://istwiki.mit.edu/istwiki/ItagFrontPage
Barton
Barton is a Library Management System and is essential to nearly all aspects of operation of the library at MIT.  Its public web
interface is used by the majority of students and faculty at MIT.  The general public have access to the MIT library, and as a 
result are also users of the web interface to Barton.  The public interface allows users to accomplish tasks such as searching 
the catalog, checking on availability etc.
Barton also has a GUI user interface to manage the internal functions of the library including catalogue management, 
purchasing and other administrative tasks.  The primary user base of the GUI application are the library staff, although it can 
also be used by visitors to the library to perform self service checkout.  The GUI application supports Kerberos as the 
mechanism to authenticate users.
The Barton application is an implementation of the Aleph 500 Integrated Library System.  More information on this product 
can be found at: http://www.exlibrisgroup.com/aleph.htm
External  Systems
Barton Application (Aleph)
Barton DB
(Oracle)
Users
Barton Web
Interface
Barton GUI
Client
Kerberos
Server
Authentication
for GUI Clients
Out Bound:
- EDI (Orders to Book Vendors)
-
System
Component
Key:
Related
System
Other MIT
System
External
System
In Bound:
- US Government Docs DB
- OCLC
- Yankee Book Peddler
- LTI
- EDI (Invoices)
Other MIT Systems
Out Bound:
- Data Warehouse
- MITSIS
- SAP
- Vera
In Bound:
- Data Warehouse
Web Server -  Apache
WWW Server
Self-Check  Server
PC Server
Z39.50 Server
S
e
a
r
c
h
C
o
l
l
e
c
t
i
o
n
s
A
c
c
o
u
n
t
M
a
i
n
t
e
n
a
n
c
e
R
e
p
o
r
t
s
&
B
a
t
c
h
J
o
b
s
C
o
u
r
s
e
R
e
s
e
r
v
e
s
A
c
q
u
i
s
i
t
i
o
n
s
A
d
m
i
n
i
s
t
r
a
t
i
o
n
A
l
e
p
h
A
D
M
C
a
t
a
l
o
g
i
n
g
C
i
r
c
u
l
a
t
i
o
n
I
t
e
m
s
O
P
A
C
S
e
r
i
a
l
s
T
a
s
k
M
a
n
a
g
e
r
S
e
l
f
S
e
r
v
i
c
e
C
h
e
c
k
o
u
t
Facility or
Location
Key:
Physical
Server or
Storage
Facility W91 - Primary
Production  Server:
Hardware: Sun E450, 4 CPUs,, 4GB Ram
Operating System: Sun Solaris
Software:
- Aleph (Barton)
- Barton Web Server
- Oracle Database Server
Attached Storage for
Database
Vendor:
Model:
Capacity:
MIT NET
Client  Computers
Hardware: Varied
Operating System: Windows
Software:
- Bartion GUI Client
Barton Logical Architecture Diagram
Barton Physical Architecture Diagram
56
Page
Prepared by Sapient for MIT
Version 0.1 – August – September 2004
This document represents a snapshot of an evolving set of documents.  For information on further iterations, please visit: http://istwiki.mit.edu/istwiki/ItagFrontPage
COEUS
COEUS is an application developed internally at MIT to manage grants.  There are several aspects to this process that are 
managed by COEUS
• Proposal Development and Submission
• Awards Tracking
• Grant Accounting
COEUS was until recently exclusively accessed through a PowerBuilder client, which accessed an Oracle database.  The result 
of this initial architecture is that significant amounts of business logic reside in PL/SQL stored procedures in the Oracle.  This 
has proven valuable as it enabled a recent re-write of the application from PowerBuilder to a three tier Java architecture.  The 
current COEUS architecture makes use of a set of application components residing in an Apache Tomcat instance.  The 
components are invoked by the JSP/Struts web interface to create a web based interface to some portions of COEUS; the web 
interface is a “light” interface that does not offer the full functionality of the COEUS application to the user.
External  Systems
Users
Legacy
PowerBuilder
Client
Out Bound:
- Grants.gov (future)
System
Component
Key:
Related
System
Other MIT
System
External
System
In  Bound:
- Grants.gov (future)
Other MIT Systems
Out Bound:
- EDI for Proposal Development
- Datawarehouse
- SAP
- Account Maintenance
- Sponsor Maintenance
- Customer Record
In  Bound:
- EDI for Awards
Kerberos
KDC
COEUS  Database
(Oracle)
PL/SQL  Business
Logic
Relational  Data
Storage
Swing GUI
Client
Apache Web Server
Tomcat  Application Server
JSP/Struts Web Interface
COEUS  Application  Tier
P
r
o
p
o
s
a
l
D
e
v
I
n
s
t
P
r
o
p
o
s
a
l
A
w
a
r
d
s
R
e
p
o
r
t
T
r
a
c
k
N
e
g
o
t
i
a
t
i
o
n
s
C
o
n
f
l
i
c
t
o
f
I
n
t
e
r
e
s
t
H
u
m
a
n
S
u
b
j
e
c
t
s
P
e
r
s
o
n
S
u
b
-
C
o
n
t
r
a
c
t
Facility or
Location
Key:
Physical
Server or
Storage
Facility W91 - Primary
Production Web and Application Server:
Hardware: Sun 280R, 2CPU, 2GB RAM
Operating System: Sun Solaris
Software:
- Apache Web Server
- Apache Tomcat
- COEUS Web Application
Production  Database Server:
Hardware: Sun 280R, 2CPU, 2GB RAM
Operating System: Sun Solaris
Software:
- Oracle Database Server 9i
Storage  for Database
MIT SAN
COEUS Logical Architecture Diagram
COEUS Physical Architecture Diagram
The complete user interface for COEUS is a Java Swing GUI client.  This enables the user to accomplish any task that COEUS 
is capable of.  The Swing client invokes the same application components as the web interface.  The Swing client is a direct 
replacement for the PowerBuilder client, which will probably be retired in the near future.
The Swing application uses Kerberos for authentication, though not in the standard way.  Problems with the Java Runtime 
Environment on windows mean that a Swing application cannot easily access the Kerberos ticket cache located on the user’s 
machine.  Therefore the Swing application must re-activate the Kerberos login process for the user and create a separate 
ticket cache for the application.  This results in the application using the secure and well tested Kerberos infrastructure and 
eliminates the need for a separate set of credentials for the user.  It is expected that in future, when the Java Runtime 
Environment compatibility problems have been solved, that COEUS will become a fully Kerberized application.
COEUS currently uses the MIT EDI service to communicate with a government agency for both sending proposals and 
receiving award information.  It is expected that in the near future this will be migrated to a direct integration to the 
grants.gov infrastructure using Web Services.
57
Page
Prepared by Sapient for MIT
Version 0.1 – August – September 2004
This document represents a snapshot of an evolving set of documents.  For information on further iterations, please visit: http://istwiki.mit.edu/istwiki/ItagFrontPage
Data Warehouse
The Data Warehouse provides the MIT community with integrated data from various administrative systems stored in one 
location. It is a read only database and therefore, information represented in it is maintained by other systems, called 
“systems of record”.  The main purpose of the Data Warehouse is to serve as a central reporting and data distribution 
environment for Departments, Labs and Centers at MIT. The Data Warehouse acts as a hub, to facilitate the exchange of 
information between systems and therefore serves as the enterprise information infrastructure at MIT. 
Reports can be created from the Data Warehouse using any SQL query tool.  The tool most often used at MIT is 
BrioQuery.TheData Warehouse website contains standard reporting templates which can be downloaded and run by DLC 
users.  Users can also create their own adhoc reports as needed. Reports and/or query results can be exported into other 
software programs, such as Microsoft Excel.  DLC users can also join local data with data from the Data Warehouse to 
produce custom report of interest to their particular DLC.
There are various advantages of using the warehouse as a reporting tool. The Data Warehouse tables are specifically 
designed for end user adhoc reporting. Since the Warehouse is a central repository for MIT Data, a user can obtain all the 
information he/she needs from various systems at one place instead of having to obtain it from each system separately.
Data Warehouse Logical Architecture Diagram
Data Warehouse Physical Architecture Diagram
The operational hours of the Data Ware house are as follows.  The Data Warehouse is available seven days a week, except 
on Saturday afternoon from 6:00 -10:00 P.M.  This time is used for weekly backups.  The Normal User hours of the 
Warehouse are between 8:00 A.M. and 8:00 P.M daily.  During these hours all data is stable and is not altered by any 
incoming feeds.  Data is loaded daily into the Warehouse between 8:00 P.M. and 6:00 A.M.  Although the Warehouse can be 
accessed during these house, the data maybe in an inconsistent state since it is being refreshed by the system of records. 
Data is extracted from the Warehouse between 6:00 A.M. and 8:00 A.M.  This time is set aside to allow systems refresh their 
data extracts from the Data Warehouse without affecting end user response time.  Users may also access the Warehouse 
during this time, but the response time may be slow.
Data
Warehouse DB
(Oracle)
Users
Brio Query
and/or SQL
(or any SQL based
query tool)
Authentication
System
Component
Key:
Related
System
Other MIT
System
External
Systems
Other MIT Systems
Incoming:
y Admissions
y Alumni
y COEUS
y Cyborg
y EHSWeb
y Insite
y Library: Barton
y Lincoln Labs SAP
y MIT ID
y MOIRA
y Nimbus
y PPL Keys
y Roles
y SAP
y SIS
y Student Payroll
y Web Hits
Outgoing:
y Active Directory
y Advance
y Case Tracker
y COEUS
y Current Payroll
System
y EHSWeb
y LNS
y Medical: Practice
Management
System
y MIT Directory
y MOIRA
y Nimbus
y OCW
y Request Tracker
y RLE
y Roles
y SAP
y SIS/MITSIS
y Stellar
y TLO/Forrester
External Systems
Incoming:
No regular
feeds.  Some static data (CIP,
Institutions, etc)
Outgoing:  
None
Process and
Transform
Facility W91 - Primary
Facility Offsite  - Backup
Production Server:
Hardware: HP ES40, 2 CPUs, 4 GB of Memory
Operating System: HP Unix
Software: Oracle Database Server
RAID for Database
Storage (resides on a
SAN storage cabinet)
Vendor: HP
Model:  HP EMA12000
with HSG80 controllers
Capacity: 576.6 GB
Total used: 81%
Nightly file system
backup
Weekly full Database
backup
Facility or
Location
Key:
Physical
Server or
Storage
Desktop Client
Web Collection of
Report Templates
58
Page 
Prepared by Sapient for MIT
Version 0.1 – August – September 2004
This document represents a snapshot of an evolving set of documents.  For information on further iterations, please visit: http://istwiki.mit.edu/istwiki/ItagFrontPage
DSpace
DSpace was developed as a result of a joint project between MIT Libraries and Hewlett-Packard. Its purpose is to provide 
long term storage options of digital products to MIT faculty and Researchers.  Users of DSpace can easily search, access, and 
read DSpace items through the Internet.   While contributors can digitally distribute and preserve various formats of content 
including text, audio, video, images, datasets, and more.  Digital work can be stored in various collections that are maintained
by different MIT Communities.  
At MIT, DSpace provides its users access to all research material at the institute through one interface.  However, 
understanding that access restrictions are a need, policies can be customized to follow closely the need of any individual 
community at MIT.  In addition the repository is organized in a manner which takes into account the various workflow issues 
which can be present at a multi-disciplinary institute such as MIT.
DSpace is an open source product and is available under the BSD open source license to other research institutions.  These 
institutions may chose to run the project in its current form or modify it to their specific needs.   It can be downloaded from 
SourceForge where users can access installation instructions to help new users install and run the application.  (DSpace will 
run on any UNIX or LINUX operating system.)
Database - PostgeSQL
Users
Web Server - Apache
Application - DSpace
Other MIT Systems
Incoming:
Outgoing:
External  Systems
Incoming:
y OCW
y Sloan  Space
Outgoing:
y Sloan  Space
Web UI
(JSPs)
System
Component
Key:
Related
System
Other MIT
System
External
Systems
Application Server - Tomcat
OAI PMH
Admin
Handle
Search
Browse
History
Authorization
Workflow
Content
Management
E-Person
File System
File  System
File  System
X509
Certificates
CNRI  Handle
Server
CNRI  Handle
Server
SRU / SRW
Facility 14S - Primary
Facility 14S - Backup
Production  Server:
Hardware: HP
Operating System: Redhat Linux
Software: PostgreSQL Database Server
Backup Server:
Hardware: HP
Operating System: Redhat Linux
Software: PostgreSQL Database Server
RAID for Database
Storage
Vendor: HP
Model:
Capacity: 10 Tb
Facility or
Location
Key:
Physical
Server or
Storage
Tape Drive
DSpace Logical Architecture Diagram
DSpace Physical Architecture Diagram
As stated, DSpace is content is produced and managed by various communities at MIT.  A DSpace community represents any 
academic unit at MIT which produces research.  Each community should designate a coordinator to work with the DSpace 
staff.  All individuals wishing to submit work through DSpace must belong to an existing community in DSpace.   
Shown below is the logical and physical diagrams for DSpace.  For more information on DSpace technology and the DSpace
project, visit: http://www.dspace.org
59
Page
Prepared by Sapient for MIT
Version 0.1 – August – September 2004
This document represents a snapshot of an evolving set of documents.  For information on further iterations, please visit: http://istwiki.mit.edu/istwiki/ItagFrontPage
EHSWeb
EHSWeb is MIT’s Environmental Health and Safety Management System.  It provides a framework for DLCs to manage 
training and requirements for training for its employees.  The EHS system was developed to help MIT with its policy towards 
safety in research and teaching.  In addition EHSWeb helps provide MIT with accountability with environmental health and 
safety stewardship and still maintain an independence in research and teaching.  
The EHSWeb system has various user interfaces to allow users to perform the actions outlined above.  Each user group of the 
application can use the appropriate interface to conduct their daily business.  These interfaces are shown below, indicative of 
their purpose.
The Diagrams below display the Logical and Physical Architecture of EHSWeb. The Logical Architecture diagram displays 
systems in addition to the EHSWeb application.  These systems include SAP, PI/Space Registration, Sara and Netcaster.  An 
explanation of these systems follows.  SAP contains information about the training events MIT community members can 
attend and those they have already attended.  Therefore this information must be fed into EHSWeb to gain a holistic 
understand of the training an individual has taken.   The PI/Space Registration system allows Principle Investigators of 
various areas at MIT to keep track of the hazards in their area of responsibility.  This information allows the EHSWeb
application to gain an understanding of the training needs people may have due to the spaces they are currently working in.  
Finally, Netcaster is a web based application to allow MIT community members to take online training courses.  It manages 
course information and completion and must feed this to EHSWeb to indicate people are completing their required training 
courses.
Training  Records
 Requirements
DB
(Oracle)
Users
System
Component
Key:
Related
System
Other MIT
System
External
Systems
Other MIT Systems
Incoming:
y SAP TEM (On
Campus)
y SAP TEM (Lincoln
Labs)
y Roles
Outgoing:
y Data  Warehouse
External  Systems
Incoming:
y Netcaster (Web
based  courses)
Outgoing:
y Netcaster (Web
based  courses
Entering  Training
Rules
UI
Training  Records
Input
UI
Training  Needs
Assessment
UI
EHS Web
Training Records &
Requirements
SAP  Training
Events  Module
(On Campus)
SAP  Training
Events  Module
(Lincoln  Labs)
Data Warehouse
PI / Space
Registration
SARA
(Reporting
Inventory)
Netcaster
Other MIT Systems
Facility W91 - Primary
Facility E40  - Backup
RAID for Database
Storage
Vendor:
Model:
Capacity:
Facility or
Location
Key:
Physical
Server or
Storage
Production and Application Server:
Hardware: Sun
Operating System: Sun Solaris
Software:
- Apache Web Server
- Apache Tomcat
Production  Database Server:
Hardware: Sun
Operating System: Sun Solaris
Software:
- Oracle Database Server
Test/Backup  Server:
Hardware: Sun
Operating System: Sun Solaris
Software:
- Apache Web Server
- Apache Tomcat
EHSWeb Logical Architecture Diagram
EHSWeb Physical Architecture Diagram
Currently there are plans to move the EHSWeb functionality into SAP.  By February 2005 the inspection and audit phases are 
expected to go live, followed by the training module in June 2005.   
60
Documents you may be interested
Documents you may be interested