mvc open pdf in new tab : .Net extract text from pdf SDK software API wpf windows .net sharepoint migrating-to-drupal0-part1198

Acquia   •   acquia.com 
MSKU#: 0046-110901
Drupal’s advantages for running enterprise websites are well established by such 
companies as FedEx, The Economist, and The White House. But many who 
would like to use it hesitate because they fear loss of assets now managed by 
their current site’s platform, or expect the procedure to transfer those assets to 
be prohibitively difficult.
This paper examines scenarios for migrating from other content-management 
systems (CMSes) and web applications, such as Vignette, Jive, FatWire, 
ColdFusion, and Joomla
1
. It evaluates reasons for migration, describes migration 
methods and tools, and suggests best practices. 
Executive Summary
Websites become harder to maintain as they age. First, evolving web trends 
demand capabilities that older technologies don’t have. Second, enterprise data 
and site structure become messy, calling for a reorganization. Third, business 
factors (such as the availability of qualified consultants) may make the legacy 
system uneconomic to maintain.
Many organizations seek to address all three problems by migrating their sites to 
a modern CMS. But standing in their way are uncertainties about the migration 
process, among them:
„„
How can we best plan the migration?
„„
Will we be able to transfer all our data, including users, tags, and 
metadata?
„„
Do the reasons for migrating justify the costs?
  Migration procedures vary depending on the source CMS’ back-end database. Some notes for 
migration from specific CMSes are at http://drupal.org/handbook/migrating.
Migrating a Website to Drupal
Smoothly Transfer Content, Users, Interface, and Metadata
.Net extract text from pdf - software Library project:C# PDF Convert to Text SDK: Convert PDF to txt files in C#.net, ASP.NET MVC, WinForms, WPF application
C# PDF to Text (TXT) Converting Library to Convert PDF to Text
www.rasteredge.com
.Net extract text from pdf - software Library project:VB.NET PDF Convert to Text SDK: Convert PDF to txt files in vb.net, ASP.NET MVC, WinForms, WPF application
VB.NET Guide and Sample Codes to Convert PDF to Text in .NET Project
www.rasteredge.com
Migrating a Website to Drupal
Acquia   •   acquia.com 
This paper answers such questions, particularly as they relate to migrations from 
such common enterprise CMSes and web applications as Jive, Vignette, FatWire, 
ColdFusion, and Joomla , as well as from sites built in static HTML.
The target CMS is Drupal, which is free and open source software. Drupal, 
which powers more of the world’s top 10,000 websites than competing CMSes
2
has emerged as a leader because of its open architecture, high-quality code 
base, and extensive selection of third-party support options. It additionally has 
migration utilities for both one-time moves and ongoing integrations with legacy 
systems.
We’ll take you through the entire migration process, from surveying assets 
to full implementation. In particular we’ll look at techniques to manage data 
transformations to actually improve your assets during the migration.
Quotes without footnote references were gathered in interviews.
Why Migrate?
Websites rarely stop functioning all of a sudden. Beyond obvious failures like 
bad links, subtler problems abound. You might discover that a new feature 
is hard or expensive to add, for example, or notice a decline in site visitors. 
Business reasons, such as the promise of lower costs or better search-engine 
optimization (SEO), may also drive migration. 
Some of the most common reasons include:
Freedom from a single-vendor solution. No matter how good a proprietary CMS 
is, it’s a castle built on sand if it makes you dependent on a single provider. The 
vendor could abruptly stop developing it in favor of another of its products, as 
Microsoft did to Content Management Server 2002 so it wouldn’t compete with 
SharePoint 2007
3
. Or the CMS’ direction may change when the company that 
created it gets acquired, as was the case with SiteFlash and NewsFlash when 
Adhesive Software disappeared. Similar situations have affected products by 
Alterian, Oracle, and Open Text
4
.
  http://www.backendbattles.com/Content_Management_Systems
  http://www.microsoft.com/cmserver/letter.mspx
  http://www.jboye.com/blogpost/vendors-kill-products-and-make-customers-pay/
software Library project:VB.NET PDF Text Extract Library: extract text content from PDF
PDF ›› VB.NET PDF: Extract PDF Text. VB.NET PDF - Extract Text from PDF Using VB. How to Extract Text from PDF with VB.NET Sample Codes in .NET Application.
www.rasteredge.com
software Library project:C# PDF Text Extract Library: extract text content from PDF file in
C# PDF - Extract Text from PDF in C#.NET. Feel Free to Extract Text from PDF Page, Page Region or the Whole PDF File. Advanced Visual
www.rasteredge.com
Migrating a Website to Drupal
Acquia   •   acquia.com 
“[FatWire] was proprietary, so we were locked into the vendor’s roadmap and features. 
We would have been with any proprietary solution, really.”
— Publishing company Chief Information Officer (given on condition of anonymity)
To “bet on a stronger horse”. One problem common to small and shrinking 
CMSes is the lack of available consultants. A healthy developer ecosystem 
requires two things: software design that allows outside parties to develop for it, 
and a user base big enough to incentivize consultants to learn it. Only a handful 
of CMSes even come close to fulfilling these requirements. Where the developer 
ecosystem doesn’t exist, you’re dependent on the CMS vendor for even the 
simplest changes.
“Once we knew that our CMS product [Collage] was going to be mothballed, it was 
time to move on. Utilizing unsupported commercial software wasn’t going to work. 
We realized this was our opportunity to reassess and execute on a long-term plan that 
would solve some of our long-standing issues.”
— Nicholas Maloney, Web Architect, Bentley University (bentley.edu)
5
To take advantage of new web technologies. Every day brings new versions 
of software and services that affect how you deliver information on the web. 
There are changes on all levels, from server applications (such as Apache) to 
third-party services (such as Google Calendar) to infrastructure software (such 
as PHP). Only CMSes with an active developer community can hope to keep up 
with — and take advantage of — all the changes.
“Single sign-on APIs were one pain point [in Jive SBS]. We also played around with its 
social functions at some point, but realized we couldn’t develop fast enough with it.”
— Alex Kirmse, Zappos IP, Inc. Senior Front-End Development Manager
To follow social trends. Internet technology is important, but it’s all done with 
people. Audiences are constantly discovering and embracing new behaviors, 
such as microblogging and content tagging, or moving en masse from one 
social network to another. If you can take advantage of these changes, you’ll not 
only improve visitor satisfaction: You may also gain valuable community-created 
content. CMSes that fail to help you follow these trends risk leaving you out of 
the next popular sensation.
One example is Facebook
6
, the wildly popular social-networking site that’s 
become a visit-me-first internet portal for millions of people. It’s possible to pipe 
content from your site to Facebook “pages” that appeal to that site’s members, 
thereby greatly extending your reach. But writing code to take advantage of 
  http://acquia.com/community/resources/library/bentley-university
  http://www.facebook.com
software Library project:VB.NET PDF Image Extract Library: Select, copy, paste PDF images
Home ›› XDoc.PDF ›› VB.NET PDF: Extract PDF Image. VB.NET PDF - Extract Image from PDF Document in VB.NET. VB.NET: Extract All Images from PDF Document.
www.rasteredge.com
software Library project:VB.NET PDF Page Extract Library: copy, paste, cut PDF pages in vb.
VB.NET: Extract PDF Pages and Save into a New PDF File. You VB.NET: Extract PDF Pages and Overwrite the Original PDF File. Instead
www.rasteredge.com
Migrating a Website to Drupal
Acquia   •   acquia.com 
Facebook’s Application Programming Interface (API)
7
can be difficult — unless 
your CMS provides assistance. For Drupal that assistance comes in the “Drupal 
for Facebook” module
8
, a free download that greatly simplifies the connection 
between your site and Facebook.
Paul Chason, Managing Partner of Acquia partner Mediacurrent, said in a webinar 
that one client moved from their proprietary CMS because it was weak on 
social-networking features the client needed, including “commenting, tagging, 
and user-generated content
9
.”
To integrate multiple systems. Acquisitions and other business changes often 
require merging data from diverse sources in one place. Some CMSes play 
well with others; some don’t. Migrating to a CMS that understands various data 
sources can allow some legacy systems to stay in place while delivering a unified 
presentation to site visitors.
“Part of the motivation to move the existing content over to Drupal was to escape 
the rigid complexity and cost associated with the Vignette CMS. The Vignette dataset 
was a 1.66GB Oracle database — and that didn’t include the more than 15,000 images 
referenced in the Vignette data which also had to be imported into the new site
10
.”
— Laura Scott, President and Creative Director at Drupal consultancy pingVision11
To accommodate growth. As a website grows above thousands of pages and 
millions of hits per month, small performance issues multiply. That’s especially 
noticeable in older or home-grown CMSes, as they were typically built without 
modern traffic loads in mind. But even some “enterprise” CMSes fail under high 
loads, simply because they’ve never been tested in such strenuous real-world 
situations.
“We had performance problems with [Jive], which seemingly couldn’t handle any kind 
of traffic. It could have been a misconfiguration on our part, but those issues disap-
peared when we migrated to Drupal.”
— Alex Kirmse, Zappos IP, Inc. Senior Front-End Development Manager
To reduce costs. There are several good open-source CMSes available for free, 
and yet some CMS vendors still charge tens of thousands of dollars in licensing 
fees. That makes sense only as long as buyers feel they’re getting equal value 
from the CMS in terms of functionality or support. Anyone who doesn’t is likely 
to seek migration to another CMS.
  http://developers.facebook.com/docs/guides/web
  http://drupal.org/project/fb
  http://acquia.com/community/resources/acquia-tv/best-practices-migrating-legacy-based-cms-
drupal
10   From a case study at http://drupal.org/popular-science
11   http://pingvision.com. Quoted in “Popular Science Magazine (PopSci.com) Case Study”, http://
drupal.org/popular-science
software Library project:C# PDF Image Extract Library: Select, copy, paste PDF images in C#
Page, a Region on a Page, and PDF Document. C#.NET extract image from multiple page adobe PDF file library for Visual Studio .NET.
www.rasteredge.com
software Library project:VB.NET PDF Form Data Read library: extract form data from PDF in
PDF software, it should have functions for processing text, image as field data from PDF and how to extract and get field data from PDF in VB.NET project.
www.rasteredge.com
Migrating a Website to Drupal
Acquia   •   acquia.com 
“We’ll be saving hundreds of thousands of dollars in the first year alone [after migrating 
from ColdFusion], just on slashing proprietary web server licenses
12
.”
— 
Mike Meyers, Chief Technology Officer of Clarity Digital Media (examiner.
com)
These reasons for switching raise an important question: If your current CMS 
isn’t cutting the mustard, which one would? For many enterprises, the answer is 
Drupal. The next section details how Drupal addresses each of these common 
shortcomings.
Why Drupal?
Since its creation in 2001, Drupal has become a leading CMS among enterprises. 
One automated measurement
13
lists it as the number-one CMS among the 
world’s top 10,000 sites, powering (among others) nowpublic.com, ubuntu.com, 
and crackberry.com. Another found that Drupal powers more than one percent 
of the top million sites
14
. Approximately 500,000 sites in total run Drupal, and 
people download the Drupal software from Drupal.org about a quarter million 
times per month
15
.
Drupal is licensed under the GNU Public License, (“GPL”), which means that no 
fees of any kind are required to deploy, extend, or maintain Drupal. This license 
additionally guarantees
16
that your organization will always be free to run, study, 
modify, and redistribute Drupal.
“Acquia Drupal
17
“ is a popular alternative to “core Drupal” that also includes 
several of the software’s most popular extensions, or “modules”. Like Drupal 
itself, it’s licensed under the GPL and shares its freedoms.
But these facts don’t explain why Drupal has achieved such success among 
high-visibility, high-traffic, mission-critical sites. Simply put, Drupal solves the 
problems that make organizations seek a new CMS. Specifically, Drupal is not 
ruled by any individual vendor. As an open-source project, anyone can use and 
modify Drupal’s code, which is entirely in unencrypted plain-text files. Its API is 
12   Quoted in “Revolutionizing The Online Media Market Through Open Source Social Publishing”, 
http://acquia.com/resources/webinars/peek-behind-scenes-%E2%80%93-how-clarity-media-
moving-examinercom-drupal-7
13   http://www.backendbattles.com/Content_Management_Systems
14   http://www.drupal.org/project/drupal
15   “The State of Drupal” keynote, http://sf2010.drupal.org/conference/sessions/state-drupal, at 
approximately 25:00. Summary at http://www.ojctech.com/blog/drupalcon-2010-keynote-
highlights.
16   Excerpted from “The Free Software Definition”, http://www.gnu.org/philosophy/free-sw.html
17   Details at http://acquia.com/products-services/acquia-drupal; downloadable from http://acquia.
com/downloads
software Library project:C# PDF Page Extract Library: copy, paste, cut PDF pages in C#.net
Able to extract PDF pages and save changes to original PDF file in C#.NET. C#.NET Sample Code: Extract PDF Pages and Save into a New PDF File in C#.NET.
www.rasteredge.com
software Library project:C# PDF Text Search Library: search text inside PDF file in C#.net
C#.NET PDF DLLs for Finding Text in PDF Document. Add necessary references: C#.NET PDF Demo Code: Search Text From PDF File in C#.NET.
www.rasteredge.com
Migrating a Website to Drupal
Acquia   •   acquia.com 
well-documented
18
, and its system of “hooks” makes it infinitely extensible. As a 
result, anyone with an intermediate knowledge of PHP and a willingness to learn 
Drupal’s API can effect changes; if your organization doesn’t have such skills in-
house, many qualified service providers are available to help you
19
.
Like other open-source projects, Drupal has no absolute authority — a fact that 
makes some people nervous. Project founder Dries Buytaert exercises strong 
guidance, controlling “official” releases that appear on the Drupal.org website. 
(Mr. Buytaert is also a founder of the Drupal support company Acquia.) But 
typical problems of single-vendor products, such as vendor lock-in and poor 
extensibility, simply aren’t possible with Drupal.
Drupal quickly adapts to new technologies, social trends, services. Where 
Drupal doesn’t address a need, individual developers create modules to fill 
the gaps — typically, within days or even hours of the appearance of new, 
complementary technologies. Over 4,000 modules are currently available for 
Drupal 6, the most-popular of which are incorporated into Drupal 7.  
Distributions are another way developers deliver Drupal-based solutions to 
address emerging needs. A distribution is an installable package that combines 
Drupal, supporting modules and design files (called themes), and custom 
programming for a specific solution or purpose. Dozens of distributions
20
let 
administrators quickly set up sites that are optimized for, among other things, 
publishing
21
, intranets
22
, and high-performance content delivery
23
.
Drupal scales to accommodate growth. Companies that produce proprietary 
software have long promoted performance and scalability as two of their 
main selling points. (Microsoft and Oracle have so targeted Linux and MySQL, 
respectively.) But criticisms of Drupal on these bases have been widely disproven 
in the field. One notable example is found in Wikimedia’s fundraising system, a 
Drupal-powered sub-site that successfully served 20,000 requests per second
24
Proving Drupal’s scalability is http://www.akademika.no, which as of October 
2008 had almost five million pages and sold almost three million products
25
.
18   http://api.drupal.org
19   http://drupal.org/drupal-services
20   http://drupaldistrowatch.com is one site that tracks Drupal distributions.
21   OpenPublish (http://openpublishapp.com) and Managing News (http://managingnews.com)
22   Open Atrium (http://openatrium.com)
23   Pressflow (http://pressflow.org)
24   http://fourkitchens.com/blog/2006/12/19/four-kitchens-builds-wikimedias-new-fundraising-
system
25   http://drupal.org/node/320616
Migrating a Website to Drupal
Acquia   •   acquia.com 
Several consultancies specialize in optimization and tuning for high-demand 
Drupal sites, among them Four Kitchens, which produces the Drupal distribution 
Pressflow.
For the popsci.com migration, pingVision’s Laura Scott noted that the 
publication had “a large and active user base” that they expected to keep 
growing. After migrating away from Vignette 7 CMS, the site achieved record-
high loads of 60 pages per second, including one period of over 1.1 million page 
views in 24 hours.
Drupal has a long projected life. Over its ten-year lifetime, Drupal has grown 
from the contributions of thousands of developers, writers, and designers. 
Version maintainers, who are appointed by project founder Dries Buytaert, 
release maintenance versions to address security issues and minor bugs 
approximately once a month; major (“integer”) versions have historically 
appeared about once every two years. (Drupal 6 was released in February 2008 
and is the current version as of May 2010. Drupal 7 will probably be released 
during the summer of 2010.)
26
The project officially supports the previous and current integer versions, i.e. 
currently Versions 5 and 6. As a result, When Drupal 7 is officially released, 
Drupal 5 will no longer be supported by the Drupal project, although private, 
commercial support is commonly available. 
Every release version of Drupal has a simple upgrade path for site data. By 
comparison, several of the competing CMSes in our survey have undergone at 
least one revision whose upgrade path was either difficult or that required the 
purchase of new licenses.
“[When we used Jive,] we’d ask, ‘How do we fix this,’ and Jive would say, ‘You have to 
upgrade to the newest version’. We’d ask, ‘Well, how do we upgrade to the newest 
version,’ and they’d say, ‘There is no clear upgrade path’.”
— Alex Kirmse, Zappos IP, Inc. Senior Front-End Development Manager
Drupal costs less. As stated earlier, Drupal costs nothing to acquire or run. By 
comparison, a typical first-year license for Jive costs $59,000; a similar license 
for FatWire costs $120,000, while one for Vignette costs a whopping $400,000
27
Costs for licenses and support beyond the first year are likewise far lower for 
Drupal, amounting to an overall year-to-year cost reduction of as much as 90 
percent, which is usually enough to quickly cover migration costs.
26   http://fourkitchens.com
27   Assumptions from which these figures were calculated, and other details, are in the white paper 
“TCO for Open Source Social Publishing: Going Beyond Social Business Software”, http://acquia.
com/community/resources/library/tco-open-source-social-publishing
Migrating a Website to Drupal
Acquia   •   acquia.com 
Part of Drupal’s lower costs come from its greater availability of resources, which 
results in favorable market forces. The same study that compared license costs 
among various CMSes also found that developers with Jive-specific knowledge 
cost considerably more than those with Drupal-specific knowledge — and were 
in considerably shorter supply.
Taking Stock of Your Current Site
Two types of questions face you when you decide to migrate your site to Drupal 
(the “target site”) from your current system (the “source site”).
First are the organizational questions:
„„
What assets comprise the source site?
„„
What parts will you migrate?
„„
Do you want to match the source site’s look and functionality 
exactly, or will you make improvements during the migration?
„„
Does the target site need to integrate with legacy systems that can’t 
be moved, such as customer databases or third-party data sources?
Answering these questions early will help you answer technical questions, which 
include:
„„
What sort of repository does the source site use to store data?
„„
How does the source site structure non-content data such as user 
profiles, taxonomies, and such metadata as creation dates?
„„
What tools are most appropriate for a fast and error-free migration?
„„
What procedures will migrate the site with minimal downtime and 
maximal data access?
The following section exposes details behind these questions by examining 
the elements that comprise your current site, discussing their management in 
Drupal, and giving tips to avoid common migration issues.
Migrating a Website to Drupal
Acquia   •   acquia.com 
Collecting Site Assets
To know what you have, you first have to know how and where it’s stored. 
Assets usually exist in three places: As records in a database, as discrete files 
on a known server, and as elements stored in a place or format outside of your 
control.
Most CMSes use database records to varying extents to store text content, 
non-text content such as graphics (as Binary Large Objects, or BLOBs), settings, 
and metadata. (Some use databases in limited ways to store operational code 
as well: In Drupal, for example, a piece of content in the database could include 
PHP code.) The main issue with transferring database information is that table 
structure varies from one CMS to another. For example, user profiles might be 
stored in a single table in one CMS, but in multiple tables in another.
Discrete files may contain multimedia such as graphics and movies, 
downloadable assets such as white papers, or any other kind of content that’s 
not stored in a database or external site. They could even contain the site’s main 
text content, if the site was created in the “traditional” way as a set of HTML files. 
(That’s usually the case for sites created using Adobe Dreamweaver.) Transferring 
these files to the target site is easy by simply copying them. The hard part is 
telling your target site where to find them, as file paths almost always change in 
the transfer.
External site assets such as mapping data are often easy to transfer. They’re 
typically embedded in the source site by reference, for example using iframe 
or object tags. In such cases all that’s needed is an identical reference in the 
target site. The offsite asset remains the same, unaffected by the migration. 
Sometimes, however, continued access to those assets requires migration of 
additional data (such as an API or certificate key), changes to the agreement with 
the asset’s third-party provider (authorizing a new target URL, for example), or 
modifications to the conduit that delivers the information (such as a specialized 
database driver).
Types of Site Assets
Regardless of how your CMS structures asset storage, the assets themselves are 
usually similar from one CMS to another. Knowing a bit about these elements 
— and how they’re stored in Drupal — will help you decide policies for their 
migration.
10 
Migrating a Website to Drupal
Acquia   •   acquia.com 
Text content
What it is: 
Text content includes all articles, blog posts, pages, and other information formats 
intended for display. Most CMSes store text content as records with at least a Title 
field and a Body field. Additional fields are common: For example, an e-commerce 
site might store product information as text content with fields such as price, size, and 
quantity available.
Further, most CMSes attach meta-information fields to each piece of text content. 
Examples of such information include a “key” that’s unique to each record, the record’s 
creation date, a link to the user who created it, access controls, and so on. One 
important class of metadata comprises tags that categorize content: CMSes often use 
these tags to aggregate similar content into (for example) topic pages.
In Drupal:  Drupal calls records of such text content “nodes”, and stores them in a set of database 
tables that begin with node. The record’s primary key is stored in the node table, while 
the content itself is in the node_revisions table. 
Drupal distinguishes the purposes of various text content — separating blog posts from 
catalog pages, for example — through the use of “content types”, stored in the node_
type table. The Nodetype module28 provides limited capabilities to move content from 
one content type to another.
“I start with a universal content type that includes such things as a de-
veloper notes field, and CCK fields to track errors. We did a large, messy 
HTML import for a client. There was no way we could tell what content 
types their HTML data should map to. So we just built an “Import” content 
type, cloned it about 30 times, and ran the import. Then we said to the 
client, ‘You guys are going to have to go in as editors and transform these 
things into the types of content they’re supposed to be.’ We were then 
able to start customizing the content types.”
— Ken Rickard, Senior Engineer, Palantir.net
Content types contain a defined set of fields, including the default Title and Body field 
mentioned above. Each node of a particular content type comprises the same fields. 
In Drupal 6 you can add other fields using the Content Construction Kit module
29
commonly known as CCK; in Drupal 7 you can add fields to content types without any 
additional software.
It’s possible to create text content records in Drupal with a series of SQL commands, 
whether done manually or driven by a program. Creating a record properly might 
affect a half-dozen database tables, though, so the potential for error is substantial. 
Further, you might need to merge or split tables, depending on how they’re stored in 
the source site. Therefore, content transfer is usually done via a combination of general 
data-manipulation and Drupal-specific tools, as will be discussed in the “Migration 
Tools” section.
28   http://drupal.org/project/nodetype
29   http://drupal.org/project/cck
Documents you may be interested
Documents you may be interested