display pdf in asp net c# : How to reverse pages in pdf control application system azure web page .net console DataScienceBook1_10-part1680

Data Science
AN INTRODUCTION TO
Jeffrey Stanton, Syracuse University
How to reverse pages in pdf - rotate PDF page permanently in C#.net, ASP.NET, MVC, Ajax, WinForms, WPF
Empower Users to Change the Rotation Angle of PDF File Page Using C#
rotate pdf pages in reader; pdf rotate pages separately
How to reverse pages in pdf - VB.NET PDF Page Rotate Library: rotate PDF page permanently in vb.net, ASP.NET, MVC, Ajax, WinForms, WPF
PDF Document Page Rotation in Visual Basic .NET Class Application
how to rotate page in pdf and save; pdf reverse page order online
© 2012, Jeffrey Stanton
This book is distributed under the Creative Commons Attribution-
NonCommercial-ShareAlike 3.0 license. You are free to copy, dis-
tribute, and transmit this work. You are free to add or adapt the 
work. You must attribute the work to the author(s) listed above. 
You may not use this work or derivative works for commercial pur-
poses. If you alter, transform, or build upon this work you may dis-
tribute the resulting work only under the same or similar license. 
For additional details, please see:
http://creativecommons.org/licenses/by-nc-sa/3.0/
This book was developed for the Certificate of Data Science pro-
gram at Syracuse University’s School of Information Studies. If 
you find errors or omissions, please contact the author, Jeffrey Stan-
ton, at jmstanto@syr.edu
. A PDF version of this book and code ex-
amples used in the book are available at:
http://jsresearch.net/groups/teachdatascience
i
INTRODUCTION TO DATA SCIENCE
C# PDF Page Move Library: re-order PDF pages in C#.net, ASP.NET
Support to reverse page order in PDF document. SDK (XDoc.PDF) is a thread-safe .NET library that can be used to adjust the PDF document pages order.
reverse pdf page order online; rotate all pages in pdf
VB.NET PDF Page Move Library: re-order PDF pages in vb.net, ASP.
Support to reverse page order in adobe PDF document in both .NET WinForms application and ASP.NET webpage. So a PDF document pages sorting control is
how to reverse page order in pdf; how to change page orientation in pdf document
ii
Data Science: Many Skills
Data Science refers to an emerging area of work concerned with the collection, preparation, analysis, 
visualization, management, and preservation of large collections of information. Although the name 
Data Science seems to connect most strongly with areas such as databases and computer science, 
many different kinds of skills - including non-mathematical skills - are needed.  
C# Word: How to Use C# Code to Print Word Document for .NET
document pages in original or reverse order within demonstrates how to print defined pages of Word powerful & profession imaging controls, PDF document, image
rotate pages in pdf online; rotate a pdf page
SECTION 1
For some, the term “Data Science” evokes images 
of statisticians in white lab coats staring fixedly 
at blinking computer screens filled with scrolling 
numbers. Nothing could be further from the 
truth. First of all, statisticians do not wear lab 
coats: this fashion statement is reserved for biolo-
gists, doctors, and others who have to keep their 
clothes clean in environments filled with unusual 
fluids. Second, much of the data in the world is 
non-numeric and unstructured. In this context, 
unstructured means that the data are not ar-
ranged in neat rows and columns. Think of a 
web page full of photographs and short mes-
sages among friends: very few numbers to work 
Overview
1.Data science includes data 
analysis as an important 
component of the skill set 
required for many jobs in 
this area, but is not the only 
necessary skill.
2.A brief case study of a 
supermarket point of sale 
system illustrates the many 
challenges involved in data 
science work.
3.Data scientists play active 
roles in the design and 
implementation work of 
four related areas: data 
architecture, data 
acquisition, data analysis, 
and data archiving.
4.Key skills highlighted by the 
brief case study include 
communication skills, data 
analysis skills, and ethical 
reasoning skills.
Word frequencies from the definitions in a Shakespeare glossary. While professional data scientists do need 
skills with mathematics and statistics, much of the data in the world is unstructured and non-numeric. 
Data Science: Many Skills
3
with there. While it is certainly true that companies, schools, and 
governments use plenty of numeric information - sales of prod-
ucts, grade point averages, and tax assessments are a few examples 
- there is lots of other information in the world that mathemati-
cians and statisticians look at and cringe. So, while it is always use-
ful to have great math skills, there is much to be accomplished in 
the world of data science for those of us who are presently more 
comfortable working with words, lists, photographs, sounds, and 
other kinds of information.
In addition, data science is much more than simply analyzing data. 
There are many people who enjoy analyzing data and who could 
happily spend all day looking at histograms and averages, but for 
those who prefer other activities, data science offers a range of 
roles and requires a range of skills. Let’s consider this idea by think-
ing about some of the data involved in buying a box of cereal. 
Whatever your cereal preferences - fruity, chocolaty, fibrous, or 
nutty - you prepare for the purchase by writing “cereal” on your 
grocery list. Already your planned purchase is a piece of data, al-
beit a pencil scribble on the back on an envelope that only you can 
read. When you get to the grocery store, you use your data as a re-
minder to grab that jumbo box of FruityChocoBoms off the shelf 
and put it in your cart. At the checkout line the cashier scans the 
barcode on your box and the cash register logs the price. Back in 
the warehouse, a computer tells the stock manager that it is time to 
request another order from the distributor, as your purchase was 
one of the last boxes in the store. You also have a coupon for your 
big box and the cashier scans that, giving you a predetermined dis-
count. At the end of the week, a report of all the scanned manufac-
turer coupons gets uploaded to the cereal company so that they 
can issue a reimbursement to the grocery store for all of the coupon 
discounts they have handed out to customers. Finally, at the end of 
the month, a store manager looks at a colorful collection of pie 
charts showing all of the different kinds of cereal that were sold, 
and on the basis of strong sales of fruity cereals, decides to offer 
more varieties of these on the store’s limited shelf space next 
month.
So the small piece of information that began as a scribble on your 
grocery list ended up in many different places, but most notably on 
the desk of a manager as an aid to decision making. On the trip 
from your pencil to manager’s desk, the data went through many 
transformations. In addition to the computers where the data may 
have stopped by or stayed on for the long term, lots of other pieces 
of hardware - such as the barcode scanner - were involved in col-
lecting, manipulating, transmitting, and storing the data. In addi-
tion, many different pieces of software were used to organize, ag-
gregate, visualize, and present the data. Finally, many different “hu-
man systems” were involved in working with the data. People de-
cided which systems to buy and install, who should get access to 
what kinds of data, and what would happen to the data after its im-
mediate purpose was fulfilled. The personnel of the grocery chain 
and its partners made a thousand other detailed decisions and ne-
gotiations before the scenario described above could become real-
ity.
Obviously data scientists are not involved in all of these steps. 
Data scientists don’t design and build computers or barcode read-
ers, for instance. So where would the data scientists play the most 
valuable role? Generally speaking, data scientists play the most ac-
tive roles in the four A’s of data: data architecture, data acquisition, 
4
data analysis, and data archiving. Using our cereal example, let’s 
look at them one by one. First, with respect to architecture, it was 
important in the design of the “point of sale” system (what retail-
ers call their cash registers and related gear) to think through in ad-
vance how different people would make use of the data coming 
through the system. The system architect, for example, had a keen 
appreciation that both the stock manager and the store manager 
would need to use the data scanned at the registers, albeit for some-
what different purposes. A data scientist would help the system ar-
chitect by providing input on how the data would need to be 
routed and organized to support the analysis, visualization, and 
presentation of the data to the appropriate people.
Next, acquisition focuses on how the data are collected, and, impor-
tantly, how the data are represented prior to analysis and presenta-
tion. For example, each barcode represents a number that, by itself, 
is not very descriptive of the product it represents. At what point 
after the barcode scanner does its job should the number be associ-
ated with a text description of the product or its price or its net 
weight or its packaging type? Different barcodes are used for the 
same product (for example, for different sized boxes of cereal). 
When should we make note that purchase X and purchase Y are 
the same product, just in different packages? Representing, trans-
forming, grouping, and linking the data are all tasks that need to 
occur before the data can be profitably analyzed, and these are all 
tasks in which the data scientist is actively involved. 
The analysis phase is where data scientists are most heavily in-
volved. In this context we are using analysis to include summariza-
tion of the data, using portions of data (samples) to make infer-
ences about the larger context, and visualization of the data by pre-
senting it in tables, graphs, and even animations. Although there 
are many technical, mathematical, and statistical aspects to these 
activities, keep in mind that the ultimate audience for data analysis 
is always a person or people. These people are the “data users” 
and fulfilling their needs is the primary job of a data scientist. This 
point highlights the need for excellent communication skills in 
data science. The most sophisticated statistical analysis ever devel-
oped will be useless unless the results can be effectively communi-
cated to the data user. 
Finally, the data scientist must become involved in the archiving of 
the data. Preservation of collected data in a form that makes it 
highly reusable - what you might think of as “data curation” - is a 
difficult challenge because it is so hard to anticipate all of the fu-
ture uses of the data. For example, when the developers of Twitter 
were working on how to store tweets, they probably never antici-
pated that tweets would be used to pinpoint earthquakes and tsu-
namis, but they had enough foresight to realize that “geocodes” - 
data that shows the geographical location from which a tweet was 
sent - could be a useful element to store with the data.
All in all, our cereal box and grocery store example helps to high-
light where data scientists get involved and the skills they need. 
Here are some of the skills that the example suggested:
Learning the application domain - The data scientist must 
quickly learn how the data will be used in a particular context.
Communicating with data users - A data scientist must possess 
strong skills for learning the needs and preferences of users. 
Translating back and forth between the technical terms of com-
5
puting and statistics and the vocabulary of the application do-
main is a critical skill.
Seeing the big picture of a complex system - After developing an 
understanding of the application domain, the data scientist must 
imagine how data will move around among all of the relevant 
systems and people.
Knowing how data can be represented - Data scientists must 
have a clear understanding about how data can be stored and 
linked, as well as about “metadata” (data that describes how 
other data are arranged).
Data transformation and analysis - When data become available 
for the use of decision makers, data scientists must know how to 
transform, summarize, and make inferences from the data. As 
noted above, being able to communicate the results of analyses 
to users is also a critical skill here.
Visualization and presentation - Although numbers often have 
the edge in precision and detail, a good data display (e.g., a bar 
chart) can often be a more effective means of communicating re-
sults to data users.
Attention to quality - No matter how good a set of data may be, 
there is no such thing as perfect data. Data scientists must know 
the limitations of the data they work with, know how to quan-
tify its accuracy, and be able to make suggestions for improving 
the quality of the data in the future.
Ethical reasoning - If data are important enough to collect, they 
are often important enough to affect people’s lives. Data scien-
tists must understand important ethical issues such as privacy, 
and must be able to communicate the limitations of data to try to 
prevent misuse of data or analytical results.
The skills and capabilities noted above are just the tip of the ice-
berg, of course, but notice what a wide range is represented here. 
While a keen understanding of numbers and mathematics is impor-
tant, particularly for data analysis, the data scientist also needs to 
have excellent communication skills, be a great systems thinker, 
have a good eye for visual displays, and be highly capable of think-
ing critically about how data will be used to make decisions and 
affect people’s lives. Of course there are very few people who are 
good at all of these things, so some of the people interested in data 
will specialize in one area, while others will become experts in an-
other area. This highlights the importance of teamwork, as well.
In this Introduction to Data Science eBook, a series of data prob-
lems of increasing complexity is used to illustrate the skills and ca-
pabilities needed by data scientists. The open source data analysis 
program known as “R” and its graphical user interface companion 
“R-Studio” are used to work with real data examples to illustrate 
both the challenges of data science and some of the techniques 
used to address those challenges. To the greatest extent possible, 
real datasets reflecting important contemporary issues are used as 
the basis of the discussions.
No one book can cover the wide range of activities and capabilities 
involved in a field as diverse and broad as data science. Through-
out the book references to other guides and resources provide the 
interested reader with access to additional information. In the open 
source spirit of “R” and “R Studio” these are, wherever possible, 
web-based and free. In fact, one of guides that appears most fre-
6
quently in these pages is “Wikipedia,” the free, online, user sour-
ced encyclopedia. Although some teachers and librarians have le-
gitimate complaints and concerns about Wikipedia, and it is admit-
tedly not perfect, it is a very useful learning resource. Because it is 
free, because it covers about 50 times more topics than a printed en-
cyclopedia, and because it keeps up with fast moving topics (like 
data science) better than printed encyclopedias, Wikipedia is very 
useful for getting a quick introduction to a topic. You can’t become 
an expert on a topic by only consulting Wikipedia, but you can cer-
tainly become smarter by starting there. 
Another very useful resource is Khan Academy. Most people think 
of Khan Academy as a set of videos that explain math concepts to 
middle and high school students, but thousands of adults around 
the world use Khan Academy as a refresher course for a range of 
topics or as a quick introduction to a topic that they never studied 
before. All of the lessons at Khan Academy are free, and if you log 
in with a Google or Facebook account you can do exercises and 
keep track of your progress.
At the end of each chapter of this book, a list of Wikipedia sources 
and Khan Academy lessons (and other resources too!) shows the 
key topics relevant to the chapter. These sources provide a great 
place to start if you want to learn more about any of the topics that 
chapter does not explain in detail.
Obviously if you are reading this book you probably have access to 
an iBook reader app, probably on an iPad or other Apple device. 
You can also access this book as a PDF on the book’s website: TBD. 
It is valuable to have access to the Internet while you are reading, 
so that you can follow some of the many links this book provides. 
Also, as you move into the sections in the book where open source 
software such as the R data analysis system is used, you will some-
times need to have access to a desktop or laptop computer where 
you can run these programs. 
One last thing: The book presents topics in an order that should 
work well for people with little or no experience in computer sci-
ence or statistics. If you already have knowledge, training, or expe-
rience in one or both of these areas, you should feel free to skip 
over some of the introductory material and move right into the top-
ics and chapters that interest you most. There’s something here for 
everyone and, after all, you can’t beat the price!
Sources
http://en.wikipedia.org/wiki/E-Science
http://en.wikipedia.org/wiki/E-Science_librarianship
http://en.wikipedia.org/wiki/Wikipedia:Size_comparisons
http://en.wikipedia.org/wiki/Statistician
http://en.wikipedia.org/wiki/Visualization_(computer_graphics
http://www.khanacademy.org
http://www.r-project.org
/
http://www.readwriteweb.com/hack/2011/09/unlocking-big-dat
a-with-r.php
http://rstudio.org
/
7
Data comes from the Latin word, “datum,” meaning a “thing given.”  Although the term “data” has 
been used since as early as the 1500s, modern usage started in the 1940s and 1950s as practical 
electronic computers began to input, process, and output data. This chapter discusses the nature of 
data and introduces key concepts for newcomers without computer science experience.
CHAPTER 1
8
About Data
The inventor of the World Wide Web, Tim Berners-Lee, is often 
quoted as having said, “Data is not information, information is not 
knowledge, knowledge is not understanding, understanding is not 
wisdom.” This quote suggests a kind of pyramid, where data are 
the raw materials that make up the foundation at the bottom of the 
pile, and information, knowledge, understanding and wisdom rep-
resent higher and higher levels of the pyramid. In one sense, the 
major goal of a data scientist is to help people to turn data into in-
formation and onwards up the pyramid. Before getting started on 
this goal, though, it is important to have a solid sense of what data 
actually are. (Notice that this book treats the word “data” as a plu-
ral noun - in common usage you may often hear it referred to as 
singular instead.) If you have studied computer science or mathe-
matics, you may find the discussion in this chapter a bit redun-
dant, so feel free to skip it. Otherwise, read on for an introduction 
to the most basic ingredient to the data scientist’s efforts: data.
A substantial amount of what we know and say about data in the 
present day comes from work by a U.S. mathematician named 
Claude Shannon. Shannon worked before, during, and after World 
War II on a variety of mathematical and engineering problems re-
lated to data and information. Not to go crazy with quotes, or any-
thing, but Shannon is quoted as having said, “The fundamental 
problem of communication is that of reproducing at one point ei-
ther exactly or approximately a message selected at another point.” 
This quote helpfully captures key ideas about data that are impor-
tant in this book by focusing on the idea of data as a message that 
moves from a source to a recipient. Think about the simplest possi-
ble message that you could send to another person over the phone, 
via a text message, or even in person. Let’s say that a friend had 
asked you a question, for example whether you wanted to come to 
their house for dinner the next day. You can answer yes or no. You 
can call the person on the phone, and say yes or no. You might 
have a bad connection, though, and your friend might not be able 
to hear you. Likewise, you could send them a text message with 
your answer, yes or no, and hope that they have their phone 
turned on so that they can receive the message. Or you could tell 
your friend face to face, hoping that she did not have her earbuds 
turned up so loud that she couldn’t hear you. In all three cases you 
have a one “bit” message that you want to send to your friend, yes 
or no, with the goal of “reducing her uncertainty” about whether 
you will appear at her house for dinner the next day. Assuming 
that message gets through without being garbled or lost, you will 
have successfully transmitted one bit of information from you to 
her. Claude Shannon developed some mathematics, now often re-
ferred to as “Information Theory,” that carefully quantified how 
bits of data transmitted accurately from a source to a recipient can 
reduce uncertainty by providing information. A great deal of the 
computer networking equipment and software in the world today 
- and especially the huge linked worldwide network we call the 
Internet - is primarily concerned with this one basic task of getting 
bits of information from a source to a destination.
Once we are comfortable with the idea of a “bit” as the most basic 
unit of information, either “yes” or “no,” we can combine bits to-
gether to make more complicated structures. First, let’s switch la-
bels just slightly. Instead of “no” we will start using zero, and in-
stead of “yes” we will start using one. So we now have a single 
digit, albeit one that has only two possible states: zero or one 
(we’re temporarily making a rule against allowing any of the big-
ger digits like three or seven). This is in fact the origin of the word 
“bit,” which is a squashed down version of the phrase “Binary 
9
Documents you may be interested
Documents you may be interested