pdf library open source c# : Export pdf form data to excel SDK control API .net web page windows sharepoint plain-person-text0-part1983

February .
e Plain Person’s Guide to Plain Text Social Science
*
Kieran Healy
Duke University
kjhealy@soc.duke.edu
Abstract:As abeginninggraduatestudentinthesocialsciences,whatsortofsowareshouldyou
usetodoyour work? Moreimportantly,what principlesshouldguideyourchoices? is article
oers some answers. e short version is: youshould usetools that give you morecontrolover
the process of data analysis and writing. I recommend you write prose and code using a good
text editor;analyze quantitative datawith R or Stata; minimize error by storing your work ina
simpleformat (plaintext is best),andmakea habit of documentingwhat you’vedone. For data
analysis,considerusing aformat likeRmarkdown andtools likeKnitr tomake yourwork more
easily reproduciblefor your futureself.UsePandoctoturnyour plain-text documents intoPDF,
HTML,or Word les tosharewithothers. Keepyourprojects ina versioncontrol system. Back
everythingupregularly.Makeyourcomputerwork foryoubyautomatingasmanyof thesesteps
asyou can. Tohelp youget started,Ibriey discussa drop-in set ofusefuldefaultstoget started
with Emacs (apowerful, freetext-editor). Isharesome templates andstyle les that canget you
quicklyfromplain texttovarious output formats.AndIpoint toseveralalternatives,becauseno
humanepersonshould recommendEmacs without presentingsomeother optionsaswell.
INTRODUCTION
You can do productive, maintainable and reproducible work with all kinds of dierent
soware set-ups. is is the main reason I don’t go around encouraging everyone
to convert to the applications I use. (My rule is that I don’t try to persuade anyone
to switch if I can’t committo oering them technical support during and aer their
*isisanupdatedandexpandedversionof‘ChoosingYourWorkowApplications’().e
main dierence isanincreased emphasison Rmarkdown,
knitr
,and
pandoc
.e
.md
source forthis
le is available at
https://github.com/kjhealy/workflow-paper
.It is also available asa website, at
http://plain-text.co
.
Export pdf form data to excel - extract form data from PDF in C#.net, ASP.NET, MVC, Ajax, WPF
Help to Read and Extract Field Data from PDF with a Convenient C# Solution
how to make a pdf form fillable in reader; change font size pdf form reader
Export pdf form data to excel - VB.NET PDF Form Data Read library: extract form data from PDF in vb.net, ASP.NET, MVC, Ajax, WPF
Convenient VB.NET Solution to Read and Extract Field Data from PDF
using pdf forms to collect data; how to fill in a pdf form in reader
move.) So this discussion is not geared toward convincing you there is One True Way
to organize things. I do think, however, that if you’re in the early phase of your career
as a graduate student in, say, Sociology, or Economics, or Political Science, you should
give some thought to how you’re going to organize and manage your work. is is so
for two reasons. First, the transition to graduate school is a good time to make changes.
Early on, there’s less inertia and cost associated with switching things around than
there will be later. Second, in the social sciences, text and data management skills are
usually not taught to students explicitly. is means that you may end up adopting
the practices of your advisor or mentor, continue to use what you are taught in your
methods classes, or just copy whatever your peers are doing. Following these paths
may leadyou to an arrangement that youwillbe happy with. But maybe not. It’s worth
looking at the options.
Two remarks at the outset. First, because this discussion is aimed at beginning
students, some readers may nd much with which they are already familiar. Even so,
some sections may still be of interest, as I have tried to keep the soware references
current. Second, although in what follows I advocate you take a look at several applica-
tions in particular, it’s not really about the gadgets or utilities. e Zen of Organization
is not to be found in Fancy Soware. Nor shall the true path of Getting ings Done
be revealed to you through the purchase of a niceMoleskineNotebook. Instead, it lies
within—unfortunately.
TWO REVOLUTIONS IN COMPUTING
When talking to undergraduates or graduate students on this topic, and when teaching
classes that use these tools, I increasingly run into the problem that it’s hard to get
started without backing up a bit rst in order to talk about how the computer they
are using works. I think the reason for this is the rise of the at-screen, touch-based
model of computing, most obviously on phones and then very secondarily on things
like Apple’s iPad or Microso’s Surface tablet. Now, most people who need to write
long documents (like papers or dissertations) or work in an involved way with data
do notuse a tablet as their primary device. Butit does seem clear that some kind of
touch-screen interaction is the future of computing for most people. Indeed, once you
consider phones properly you realize it’s the present of computing for most people.
While it is not strictly impossible, it remains very dicult to do your academic,
social-science work ona device of this sort. is is likelyto be the casefor some time, as
the tools we have are not designed up for them. at’s not surprising, but I think there
is an underappreciated tension here. Two ongoing computing revolutions are tending
is may also be true ifyou are abouttomovefrombeinga graduate studenttostartingas a faculty
member, though perhaps the rationaleis less compellinggiven the costs.
VB.NET PDF Form Data fill-in library: auto fill-in PDF form data
Create PDF from Text. PDF Export. Convert PDF to Word to PDF. Image: Remove Image from PDF Page. Image Edit Bookmark. Metadata: Edit, Delete Metadata. Form Process
exporting data from excel to pdf form; how to flatten a pdf form in reader
VB.NET Create PDF from Excel Library to convert xlsx, xls to PDF
Create PDF from Text. PDF Export. Convert PDF to Word to PDF. Image: Remove Image from PDF Page. Image Edit Bookmark. Metadata: Edit, Delete Metadata. Form Process
extracting data from pdf into excel; edit pdf form in reader
to pull in opposite directions. On one side, the mobile, cloud-centered, touch-screen,
phone-or-tablet model has brought powerful computing to more people than ever
before. is revolutionis the oneeveryone istalking about, becauseit is happening ona
huge scale and is where all the money is. Inpractice it puts single-purpose applications
in the foreground and hides from the user both the workings of the operating system
and (especially) the structure of the le system where items are stored and moved
around.
On the other side, open-source tools for plain-text coding, data analysis, and
writingare also better andmore accessible than theyhave ever been. is has happened
on a smaller scale than the rst revolution, of course. But still, these tools really have
revolutionized the availability and practice of data analysis and scientic computing
generally. eycontinue to doso, too, as peoplework to makethembetter ateverything
from slurping up data on the web to presenting it there. ese tools mostly work by
gluing together separate, specialized widgets into a reproducible workow. ey are
“bitty” or granular because the process of data analysis is that way as well. ey do
much less to hide the operating system layer—instead they oen directly mesh with
it—and they also presuppose a working knowledge of the le system underpinning the
organization of the things the researcher is using or creating, from data les to code to
gures and nal papers.
e tension is that, increasingly, people—people like the target audience of this
article—entering the world of social science wanting to work with data tend to have
little or no prior experience with text-based, command-line, le-system-dependent
tools. Inmanycases, theydo not have muchexperience makingeective use of a multi-
tasking windowing environment, either, at least in the sense of making applications
work together in theservice of a single goal. To beclear, this is not something to blame
users for. Neither is it some misguided nostalgia on my part for the command line.
Rather, it is an aspect of how computer use is changing at a verylarge scale. e coding
and data analysis tools we have are powerful and for the most part meant to allow
research products to be opened up and inspected. But the way they work clearly runs
against the current of everyday, end-use computing, which increasingly hides many
implementation details and focuses on single-purpose tasks. Again, specialized tools
are necessarilyspecialized. e net result for the social sciences inthe short to medium
term, I think, is that we will have a suite of powerful tools that enable an amazing
variety of scientic activity, developed in the open and mostlyavailable for free. But it
will get harder to teach people how to use them, and perhaps even to convince people
to try them.
As opposed tomulti-tasking inthe less-interesting sense oftryingto pay attentiontoa number of
discretetasks (writing,email,calendar,web-browsing), each controlled by a separate application.
C# PDF Form Data fill-in Library: auto fill-in PDF form data in C#
Able to fill out all PDF form field in C#.NET. RasterEdge XDoc.PDF SDK package provides PDF field processing features for learn how to fill-in field data to PDF
collect data from pdf forms; pdf form save with reader
C# Create PDF from Excel Library to convert xlsx, xls to PDF in C#
Merge all Excel sheets to one PDF file. Export PDF from Excel with cell border or no border. Free online Excel to PDF converter without email.
extracting data from pdf forms; export pdf data to excel
WHAT’S THE PROBLEM¥
e problem is that doing scholarly work is intrinsically a mess. ere’s the annoying
business of getting ideas and writing them down, of course, but also everything before,
during, and around it: data analysis and all that comes with it, and the tedious but
unavoidable machinery of scholarly papers—especially citations and references. ere
is a lot of keep track of, a lot to get right, anda lot to draw together at the time of writing.
Academic papers are by no means the onlyformof writingsubject to constraints of this
sort. Considerthissensiblediscussion by Dr. Drang, a (pseudonymous) consulting
engineer:
Idon’t write ction, but I can imagine that a lot of ction writing can
be done without any reference materials whatsoever. Similarly, a lot of
editorials and opinion pieces are remarkably fact-free; these also can
spring directly from the writer’s head. But the type of writing I typically
do—mostly for work, but also here—is loaded with facts. I am constantly
referring to photographs, drawings, experimentaltest results, calculations,
reports written by others, textbooks, journal articles, and so on. ese are
not distractions; they are essential to the writing process.
And it’s notjust reference material. Quite oen I need tomake my own
graphs and drawings to include in a report. Because the text and the
graphics are all part of a coherent whole, I need to go back and forth
between the two; the words inform the pictures and the pictures inform
the words. is is not the Platonic idealof a clean writingenvironment—a
cup of coee on an empty desk in a white room—that you see in videos
for distraction-free editors.
Some of the popularity of these editors is part of the backlash against
multitasking, but people are confusing themselves with their computers.
When I’mwriting a report, that is my single task, and I bringto bear what-
ever tools are necessary to complete it. at my computer is multitasking
by running many programs simultaneously isn’t a source of confusion or
distraction, it’s the natural and ecient way for me to get my one task
done.
Alot of academic writingis just like this. It can be tricky to manage. It’s even worse
when you have collaborators and other contributors. So, what to do?
C# WPF PDF Viewer SDK to convert and export PDF document to other
PDF from RTF. Create PDF from Text. PDF Export. Convert PDF Edit, Delete Metadata. Watermark: Add Watermark to PDF. Form Process. Data: Read, Extract Field Data.
pdf form save in reader; pdf form data extraction
VB.NET PDF - Convert PDF with VB.NET WPF PDF Viewer
Create PDF from Text. PDF Export. Convert PDF to Word to PDF. Image: Remove Image from PDF Page. Image Edit Bookmark. Metadata: Edit, Delete Metadata. Form Process
extracting data from pdf files; extracting data from pdf forms to excel
THE OFFICE MODEL AND THE ENGINEERING MODEL
Let me make a crude distinction. ere are “Oce Type” solutions to this problem,
and there are “Engineering Type” solutions. Don’t get hung up on the distinction
or the labels. Oce solutions tend towards a cluster of tools where something like
Microso Word is at the center of your work. A Word le or set of les is the most
“real” thing in your project. Changes to your work are tracked inside that le or les.
Citation and reference managers plug into them. e outputs of data analyses—tables,
gures—get dropped into them or kept alongside them. e master document may be
passedaroundfrompersonto person or editedand updatedin turn. e nal output is
exported from it, perhaps to PDF or to HTML, but maybe most oen the nal output
just is the
.docx
le, cleaned up and with the track changes feature turned o.
In the Engineering model, meanwhile, plain text les are at the center of your
work. e most “real” thing in your project will either be those les or, more likely,
the Git repository that controls the project. Changes are tracked outside the les.
Data analysis is managed in code that produces outputs in (ideally) a known and
reproducible manner. Citation and reference management will likely also be done in
plain text, as with a BibTeX
.bib
le. Final outputs are assembled from the plain text
and turned to
.tex
,
.html
,or
.pdf
using some kind of typesetting or conversion tool.
Veryoen, because of some unavoidable facts about the world, the nal output of this
kind of solution is also a
.docx
le.
is distinction is meant to capture a tendency in organization, not a rigid divide—
still less a sort of personality. Obviously it is possible organize things on the Oce
model. (Indeed, it’s the dominant way.) Applications likeScrivener, meanwhile, com-
bine elements of the two approaches. Scrivener embraces the “bittyness” of large
writing projects in an eective way, and can spit out clean copyin a variety of formats.
Scrivener is built for people writing lengthy ction (or qualitative non-ction) rather
than anything with quantitative data analysis, so I have never used it extensively. Mi-
croso Word, meanwhile, still rules large swathes of the Humanities and the Social
Sciences, and the production process of many publishers. So even if you prefer plain
text for other reasons—especially in connection with project management and data
analysis—the routine need or obligation to provide a Word document to someone is
one of the main reasons towantto be able toeasily convert things. HTML is a great
lingua franca.
is article is mostlyabout the Engineering model. But many people use the Oce
model, and you may end up working with (or for) some of them. In those cases, it is
generally easier for you to use their soware than vice versa, if only because you are
likely have a copyof Wordon your computer already. Inthesecircumstances youmight
also collaborate usingGoogleDocs or some other service that allows for simultaneously
editing the master copy of a document. is may not be ideal, but it is better than not
C# PDF Converter Library SDK to convert PDF to other file formats
Able to export PDF document to HTML file. C#.NET applications, like ASP.NET web form application and for C#.NET supports file conversion between PDF and various
how to type into a pdf form in reader; how to make pdf editable form reader
VB.NET PDF Convert to HTML SDK: Convert PDF to html files in vb.
Embed converted html files in html page or iframe. Export PDF form data to html form in .NET WinForms and ASP.NET. Turn PDF images to HTML images in VB.NET.
extract pdf form data to excel; extract data from pdf form fields
collaborating. ere is little to be gained from plain-text dogmatism in a
.docx
world.
MAKE SURE YOU KNOW WHAT YOU DID
For any kind of formal data analysis that leads to a scholarly paper, whichever model
you tend to favor, there are some basic principles to adhere to. Perhaps the most
important thing is to do your work in a way that leaves a coherent record of your
actions. Instead of doing abitof statistical work and then just keeping the resulting
table of results or graphic that you produced, for instance, write down what you did
as a documented piece of code. Rather than guring out but not recording a solution
to a problem you might have again, write down the answer as an explicit procedure.
Instead of copying out some archival material without much context, le the source
properly, or at least a precise reference to it.
Asecondprincipleis that a document, le or folder should always be ableto tellyou
what it is. Beyondmakingyour work reproducible, youwillalso needsome method for
organizing and documenting your dra papers, code, eld notes, datasets, output les
orwhatever it is you’re workingwith. In a worldof easilysearchable les, this maymean
little more than keeping your work in plain text and giving it a descriptive name. It
shouldgenerallynot mean investingtime creating some elaborate classication scheme
or catalog that becomes an end in itself to maintain.
Athird principle is that repetitive and error-prone processes should be automated
if possible. (Soware developers call this “DRY”, orDon’tRepeatYourself.) is makes
it easier to check for and correct mistakes. Rather than copying and pasting code over
and over to do basically the same thing to dierent parts of your data, write a general
function that can be called whenever it’s needed. Instead of retyping and reformatting
the bibliography for each of your papers as you send it out to a journal, use soware
that can manage this for you automatically.
ere are many ways of implementing these principles. You could use Microso
Word, Endnote andSPSS. Or Textpad andStata. Or a pile of legal pads, a calculator, a
pair of scissors and a box of le folders. But soware applications are notall created
equal, and some make it easier than others to do the Right ing. For instance, it is
possible to produce well-structured, easily-maintainable documents using Microso
Word. But you have to use its styling and outlining features strictly and responsibly,
and most people don’t bother. You can maintain reproducible analyses in SPSS, but
the application isn’t set up to do this automatically or eciently, nor does its design
encourage good habits. So, it is probably a good idea to invest some time learning
about the alternatives. Many of them are free to use or try out, and you are at a point
in your career where you can aord to play with dierent setups without too much
trouble.
e dissertation, book, or articles you write will generally consist of the main text,
the results of data analysis (perhaps presented in tables or gures) and the scholarly
apparatus of notes and references. us, as you put a paper or an entire dissertation
together you will want to be able to easily keep a record of your actions as you edit text,
analyze data and present results in a reproducible way. In the next section I describe
some applications and tools designed to let you do all of this. I focus on tools that t
together well (by design) and that are all freelyavailable for Windows, Linux and Mac
OS X. ey are not perfect, by any means—in fact, some of them can be awkward to
learn. But graduate-levelresearchandwriting canalso beawkwardto learn. Specialized
tasks need specialized tools and, unfortunately, although they are very good at what
they do, these tools don’t always go out of their way to be friendly.
Use version control
Writing involves a lot of editing and revision. Data analysis involves cleaning les,
visualizing information, running models, and repeatedly re-checking your code for
mistakes. You need to keep track of this work. As projects grow and change, and as
you explore dierent ideas or lines of inquiry, the task of documenting your work
at the level of particular pieces of code or edits to paragraphs in individual les can
become more involved over time. e best thing to do is to institute some kind of
version control to keep a complete record of changes to a single le, a folder of material,
or a whole project. A good version control system allows you to “rewind the tape” to
earlier incarnations of your notes, dras, papers and code. It lets you keep explore
dierent aspects or branches of a project. In its more developed forms it provides you
with some powerful tools for collaborating with other people. And ithelps stop you
from having directories full of les with confusingly similar names like
Paper-1.doc
,
Paper-2.doc
,
Paper-conferenceversion.doc
,
Paper-Final-revised-DONE-lastedits.doc
.
In the social sciences and humanities, you are most likely to have come across the
idea of systematic version control by way of the “Track Changes” feature in Microso
Word, which lets youseethe edits you and your collaboratorshavemadeto adocument.
Collaborative editing of a single document is also possible through platforms like
Google Docs orQuip. True version control is a way to do these things for whole
projects, not just individual documents, in a comprehensive and transparent fashion.
Modern version control systems such asMercurialandGitcan, if needed, manage very
large projects with many branches spread across multiple users. Git has become the de
facto standard, andGitHubis a place where soware developers and social scientists
make their work available, and where you can contribute to ongoing projects or make
public your own.
Modern version control requires getting used to some new concepts related to
tracking your les, and learning how your version control system implements these
concepts. ere are somegoodresourcesfor learning them. Because of their power,
these tools might seem like overkill for individual users. (Again, though, manypeople
nd Word’s “Track Changes” feature indispensable once they begin using it.) But
version control systems can be used quite straightforwardlyin a basic fashion, andthey
can oen be easily integrated with your text editor, or usedvia a friendlier application
interface that keeps you away from the command line. e core idea is shown in
Figure. You keep your work in a repository. is can be kept locally, or on a remote
server. As you work, you periodically stage your changes and then commit them to
the repository, along with a little note about what you did. Repositories can be copied,
cloned, merged, and contributed to by you or other people.
Revision control has signicant benets. A tool like Git combines the virtues of
“track changes” with those of backups. Every repository is a complete, self-contained,
cryptographically signed copy of the project, with a log of every recorded step in its
development by allof its participants. It puts you in the habit of committing changes to
ale or project piecemeal as you work on it, and (briey) documenting those changes
as you go. It allows you to easily test out alternative lines of development or thinking
by creating “branches” of a project. It allows collaborators to work on a project at
the same time without sending endless versions of the “master” copy back and forth
via email. And it provides powerful tools that allow you to automatically merge or
(when necessary) manually compare changes that you or others have made. Perhaps
most importantly, it lets you revisit any stage of a project’s development at will and
reconstruct what it was you were doing. is can be useful whether you are writing
code for a quantitative analysis, managing eld notes, or writing a paper. While you
will probablynot needto control everything inthis way, I strongly suggest youconsider
managing at least the core set of text les that make up your project (e.g., the code that
does the analysis and generates your tables and gures; the datasetitself; your notes
and working papers, the chapters of your dissertation, etc). As time goes by you will
generate an extensive, annotated record of your actions that is also a backup of your
project at every stage of its development. Services such asGitHuballow you to store
public or (for a fee) private project repositories and so can be a way to back up work
osite as well as a platform for collaboration and documentation of your work.
Why shouldyou bother to do any of this? Because the main person you are doing
it for is you. Papers take a long time to write. When you inevitably return to your table
or gure or quotation nine months down the line, your future self willhave been saved
hours spent wondering what it was you thought you were doing and where you got it
from.
Figure :
Aschematic
git
workow. ()You get themost recent version of your project from
aremote repository (such as GitHub), and then ()You “check-out”theproject to workon,
writing text or code, etc. You work on les as usual in a folder on your computer. But it is the
repository that is “real” asfar as the project is concerned. ()You edit your documents, and
once you are happy with thechanges you stage them. Behind thescenes means thechanges
are added to an index that Git uses to keep track of things. But these changes are not yet
permanently recorded. () You then commit the changes to the repository, along with a note
about what you did. is is now a rm record of thechanges. ()You “push” the changes up
to theremoterepository, which in eect also functions as a backup of your work. Over time,
the repository comes to contain a complete record of the project, any step of which can be
revisited as needed. In thesimplest case there is no remote repository, only a local oneyou
checkout and commit changes to. You can do all this from the command line, or use one of
several front-end applications designed to help you managethings.

Back up your work
Regardless of whether you choose to use a formal revision control system, you should
nevertheless have some kind of systematic method for keeping track of versions of
your les. Version-controlled projects are backed-up to some degree if you keep your
repository somewhere other than your work computer. But this is not nearly enough.
Apple’s Time Machine soware, for example, backs up and versions your les on your
disk, or to a local hard drive, allowing you to step back to particular instances of the
le you want. is still isn’t enough, though. You need regular, redundant, automatic,
o-site backups of your work. Because youare lazy andprone to magical thinking, you
will not do this responsiblyby yourself. is is why the most useful backup systems are
the ones that require a minimum amount of work to set up and, once organized, back
up everything automatically without you having to remember to do anything. is
means paying for a secure, osite backup service likeCrashplan, orBackblaze. Osite
backup means that in the event (unlikely, but not unheard of) that your computer and
your local backups are stolen or destroyed, you will still have copies of your les. I
know of someone whose oce building was hit by a tornado. She returned to nd her
les and computer sitting in a foot of water. You never know. Less dramatically, but no
less catastrophic from the point of view of one’s work, I know people who have lost
months or even years of work as a result of dropping a laptop, or having it stolen, or
simplyhaving their computer (or “backup drive”) failfor no apparent reason. Like seat
belts, you don’t need backups until you really, reallyneed them. As Jamie Zawinskihas
remarked,whenitcomestolosingyourdata“euniversetendstowardmaximum
irony. Don’t push it.”
EDIT TEXT
Use a Text Editor
If you are going to be doing quantitative analysis of any kind then you should write
using a good text editor. e same can be said, I’d argue, for working with any highly
structured document subject to a lot of revision, such as a scholarly paper. Text editors
are dierent from word processors. Unlike applications such as Microso Word, text
editors generally don’t make a big eort to make what you write look like as though it
is being written on a printed page. Instead, theyfocus on working with text eciently,
while keeping it in a plain and portable format, as opposed to binary le formats like
.docx
.Figure shows an example.
For further argument aboutthe advantages of text-editors over word processors see Allin Cottrell’s
polemic, “WordProcessors:StupidandInecient.”
Documents you may be interested
Documents you may be interested