count pages in pdf without opening c# : Delete pages from pdf file online Library application class asp.net html web page ajax antocuni-thesis3-part303

Finally, the translation toolchain transfers the control to one its backends, which are re-
sponsible to actually generate the nal executable. Throughout the text, we will refer
to
pypy-xxx
to indicate the executable produced by the backend xxx. At the moment of
writing, there are three maintained backends:
 The C backend is based on lltype and emits C source code, which is in turn compiled
by either
gcc
or Visual C++
3
. The produced executable is equivalent to CPython,
as it is a native executable for the target platform, which currently can be Linux,
Mac OS X or Microsoft Windows.
 The CLI backend [Cun06] [AACM07] is based on ootype and emits IL code for the
CLI, i.e. the virtual machine, at the core of the .NET Framework. Currently, both
Mono and Microsoft CLR are supported. The produced executable is roughly the
counterpart of IronPython, although the latter is much better integrated with the
hosting platform.
 The JVM backend [AACM07] is also based on ootype and emits bytecode for the
JVM. Although the backend is complete, the resulting
pypy-jvm
is of little practical
use because it still cannot access the hosting Java environment. It aims to be the
equivalent of Jython, a Python implementation written in Java and fully integrated
with the JVM.
3.3 JIT compiler generator
One of the most interesting components of the translation toolchain optionally generates
aJIT compiler from the source code of the interpreter, in an automated way.
From the end user point of view, the presence of the JIT compiler is completely transpar-
ent
4
.Theexecutable contains both theoriginal interpreter and the generated JIT compiler:
the code starts being interpreted, then the JIT automatically compiles the so called hot
spots, i.e. the parts of the program that are executed more often and thus are most useful
to optimize. The generated compiler is a tracing JIT: Chapter 5 describes the general idea
behind it, and the current state of the art.
From the language implementor point of view, the generation of the JIT compiler is also
mostly transparent: the programmer only needs to annotate the source code of the inter-
3
Thegenerated code is ANSI C, butmakes optionallyuseof some speciccompiler extension depending
on the exact compiler we are using.
4
Actually, there are hooks that the end user can call to tune the various parameters of the JIT, even
though this it is not strictly necessary.
22
Delete pages from pdf file online - Library application class:C# PDF Page Extract Library: copy, paste, cut PDF pages in C#.net, ASP.NET, MVC, Ajax, WinForms, WPF
Easy to Use C# Code to Extract PDF Pages, Copy Pages from One PDF File and Paste into Others
www.rasteredge.com
Delete pages from pdf file online - Library application class:VB.NET PDF Page Extract Library: copy, paste, cut PDF pages in vb.net, ASP.NET, MVC, Ajax, WinForms, WPF
Detailed VB.NET Guide for Extracting Pages from Microsoft PDF Doc
www.rasteredge.com
preter with few hints to drive the JIT compiler generator. These hints will be covered in
details in Chapter 6.
The JIT compiler generator is divided into a frontend and several backends: to avoid
confusion with the translation backends described above, we will refer to these as JIT
backends.
The frontend contains all the architecture independent code: its job is to analyze the
interpreted running program, nd the hotspots, and optimize them. Its nal result is a
low level architecture independent representation of the program to compile: the actual
generation of the executable machine code is done by the JIT backend. At the moment of
writing, there are two maintained JIT backends:
 the x86 JIT backend, which generates code for the IA-32 architecture, i.e. for all the
common 32 bit Intel-compatible processors around. In the future, there will probably
be an x86
64 JIT backend to exploit the new instruction set of the 64 bit processors
 the CLI JIT backend, which emits bytecode for the CLI virtual machine of the .NET
Framework. The generated bytecode will in turn be translated into machine code by
the .NET’s own JIT compiler (see Section 4.2 for details).
It is obvious that thechoiceof the JIT backend is dependent on the choice ofthe translation
backend: in particular, the x86 JIT backend is usable only in conjunction with the C
translation backend, and the same for the CLI JIT backend and its homonym translation
backend.
From an implementation point of view, the CLI JIT backend represent one of the major
contributions of this thesis, and will be described in detail in Chapter 7.
3.4 Why choosing PyPy
In summary, we think that PyPy is a very good choice for the kind of research we are
interested in. First of all, it is a mature project with an already working infrastructure
and a vibrant (although not so large) development community, which is ideal to develop
new ideas and solutions.
Moreover, the architecture and the modularity of the codebase allows us to concentrate
on the main issues we are interested in: in particular, we do not have to worry about the
complex semantics of Python, or to implement all the well known compilation techniques
that form the starting point for the \interesting" work. In addition, by reusing PyPy we
can apply the JIT compilation techniquesdescribed in this thesis toa real language, making
the evaluation much more trustworthy than if we applied them to e.g. a toy language.
23
Library application class:VB.NET PDF Page Delete Library: remove PDF pages in vb.net, ASP.
Easy to delete PDF page in .NET WinForms application and ASPX webpage. Enable specified pages deleting from PDF in Visual Basic .NET class.
www.rasteredge.com
Library application class:C# PDF File & Page Process Library SDK for C#.net, ASP.NET, MVC
empty) page to a PDF and adding empty pages to a PDF from a supported file format, with You may feel free to define some continuous PDF pages and delete.
www.rasteredge.com
Last but not least, by working on a meta level the nal result is more than just a fast
implementation of Python: by providing a multiplatform JIT compiler generator, PyPy
may become a very appealing framework to implement in a simple way all kinds of fast
and portable dynamic languages: see for example [BKL
+
08] for a description of the imple-
mentation of Smalltalk and in PyPy, and [BV09] for a description of PyGirl, a Gambeboy
emulator.
24
Library application class:C# PDF Page Delete Library: remove PDF pages in C#.net, ASP.NET
Advanced component and library able to delete PDF page in both Visual C# .NET WinForms and ASP.NET Ability to remove a range of pages from PDF file.
www.rasteredge.com
Library application class:C# PDF Page Insert Library: insert pages into PDF file in C#.net
code, how to rotate PDF document page, how to delete PDF page using programmers are capable of adding and inserting (empty) PDF page or pages from various
www.rasteredge.com
25
Library application class:VB.NET PDF Page Insert Library: insert pages into PDF file in vb.
to create a blank PDF page with related by using following online VB.NET may use the following VB.NET demo code to insert multiple pages of a PDF file to a
www.rasteredge.com
Library application class:C# PDF File Split Library: Split, seperate PDF into multiple files
splitting PDF file into two or multiple files online. Support to break a large PDF file into smaller files. Separate PDF file into single ones with defined pages
www.rasteredge.com
Chapter 4
Characterization of the target
platform
From an implementation point of view, this thesis is about a dynamic JIT compiler for the
.NET platform, and in particular for its Virtual Machine (VM), the CLI. However, our
research is not strictly limited to the CLI, but it is potentially applicable to all the VMs
which are similar enough.
What does \similar enough" mean? Dening the concept is hard, because even a small
dierence about a particular feature of the VM can have a big impact on the implemen-
tation strategy. On the other hand, some of the solutions proposed in this thesis can be
applied equally well to virtual machines such as e.g. LLVM, whose underlying philosophy
is very dierent from the CLI’s one, but still share some commonality. LLVM [LA04]
stands for Low Level Virtual Machine and, as the name suggests, it is a virtual machine
whose instruction sets is particularly close tothe metal, contrarily to object oriented virtual
machines whose instruction set is more high level.
This is especially true when speaking about performance: when targeting a VM, it is hard
to accurately predict the performance behavior of the compiled programs, as they are
going to be executed on a number of dierent implementations of the virtual machine. For
example, .NET programs can berun either under theCLR, i.e. the original implementation
from Microsoft, or under Mono, an alternative open source implementation. Moreover, all
the implementations rapidly evolve over time, each new version providing slightly dierent
performance of each feature or construct of the VM.
However, for languages implementors, this is far from being ideal: during the development
of a compiler, they need to take a huge number of decisions about which constructs to use
and which not to use to implement each particular feature, but their assumption might
not be valid for alternative implementations or newer/older versions of the VM. As we will
26
Library application class:VB.NET PDF File Split Library: Split, seperate PDF into multiple
PDF document file to one-page PDF files or they can separate source PDF file to smaller PDF documents by every given number of pages. This online VB tutorial
www.rasteredge.com
Library application class:VB.NET PDF File Compress Library: Compress reduce PDF size in vb.
size, images size reducing can help to reduce PDF file size effectively will also take up too much space, glyph file unreferenced can Delete unimportant contents
www.rasteredge.com
see next in this chapter, this is especially true for more esoteric features or for constructs
used in a slightly dierent way than they have been designed.
4.1 Dynamic loading of new bytecode
By denition, a JIT compiler emits new code during the execution of the program: thus,
the rst and most important requirement that a VM needs to fulll in order to apply this
research is the ability of generating and loading new bytecode at runtime, although the
exact details vary between the CLI and the JVM.
For the CLI, the standard library of the .NET Framework, provides the necessary tools to
generate and load single methods, in the namespace
System.Reflection.Emit
:in partic-
ular, by instantiating the class
DynamicMethod
it is possible to create new methods that
are not bound to any particular class.
On the other hand, in the JVM the minimum unit of loading is the class: by writing a
custom classloader, it is possible to generate and load new classes, and hence new methods,
on the  y. Moreover, there are external libraries such as ASM[asm] and BCEL[bce] that
simplify the task of generating and loading these classes.
4.2 JIT layering
Anotherimportantfeatureshared by theCLI and theJVM is thepresenceofa JIT compiler
that translates the intermediate code into executable machine code
1
.
For the cases we are analyzing, the JIT compiler generated by the PyPy translation
toolchain emits code in the intermediate format proper of the hosting virtual machine.
Then, this intermediate code is in turn compiled into executable machine code by the JIT
compiler of the VM itself.
Thus, before being translated to executable machine code, the source code of our programs
passes through two dierent JIT compilation layers:
 the high level layer, implemented by the PyPy translation toolchain
 the low level layer, implemented by the VM itself
1
The specications of both the CLI and the JVM does not mandate the presence of a JIT compiler,
which should be considered an implementation detail. However, all the current implementations of the
CLI employ a JIT compiler, as well as all the most popular ones of the JVM.
27
Library application class:C# HTML5 PDF Viewer SDK to view PDF document online in C#.NET
File: Merge PDF; C# File: Split PDF; C# Page: Insert PDF pages; C# Page: Delete PDF pages; C# Read: PDF Text Extract; C# Read: PDF
www.rasteredge.com
Library application class:VB.NET PDF File Merge Library: Merge, append PDF files in vb.net
Combine multiple specified PDF pages in into single one file. Append one PDF file to the end of another one in VB library download and VB.NET online source code
www.rasteredge.com
JIT layering is a novel concept introduced with this thesis. In theory, if the low level
JIT compiler were good enough, it could produce optimal code for whatever construct it
encounters; in practice however, this rarely happens because either the low level JIT does
not employ advanced techniques (as it is the case of the CLI), or it cannot have a deep
understanding of the language semantics, thus missing a lot of optimization opportunities
(as proved by the current implementations of dynamic languages for the JVM).
By adding an additional JIT compilation layer, specialized fora specichigh-level language,
much better and ecient code can be generated without modifying the underlying VM.
This has several advantages:
 since the high level JIT compilers do not touch any of the internals of the VM, it is
automaticaly portable across multiple implementations of the VM itself
 usually, the existing VMs and their corresponding JITs are very complex pieces of
software, hard to modify: by writing our JIT on top of that, we avoid this problem;
moreover, this way it is much easier to experiment with new features
 for the same reason, our approach is the only viable solution in cases we do not have
access to the codebase of the VM, as in the case of Microsoft .NET
The main drawback of this approach is that the high level JIT compiler adds a overhead:
if on the long run the time spent in the compiler is negligible compared to the time saved
by running the optimized code instead of the non optimized one, in the short run programs
could be slower.
As we will show in Chapter 8, this thesis proves that this approach is eective, and that
the resulting implementation of the language can be much faster than a more ordinary
implementation which relies only on the low level JIT. At the same time, we will also see
that the overhead of the high level JIT compiler is not worth of in case of short running
programs.
4.3 Immutable methods
As we seen in Section 4.1, both the CLI and the JVM oer the possibility of generating
and loading new code at runtime. However once it has been loaded, it is not possibile to
modify the code inside methods.
In particular, both VMs do not oer any support for incremental lazy compilation. For
example, there are cases in which we do not want to (or we cannot) eagerly generate the
bytecode for all the possible code paths inside a method: the usual solution is to generate
28
the code only for the hot paths, and delay the generation of the others until they are
reached for the rst time, or until they have proved to be hot enough to justify the cost of
the compilation.
Unfortunately, since it is not possible to modify a method, such a strategy cannot be
easily implemented. As we will see in Section 7.5, this restriction is a serious limitation for
language implementors who want to use adaptive techniques, and the proposed solutions
(or, better, workarounds) either have a negative impact on the time spent for the high level
JIT compilation or on the eciency of the generated code.
4.4 Tail calls
On the CLI, we can explicitly mark a method invocation as a tail call, assuming that it
is in tail position
2
.Tail calls behaves exactly as normal calls, with the dierence that the
call frame of the caller is removed from the stack and replaced by the call frame of the
callee: the result is that we can have an arbitrary deep chain of tail calls without any risk
of exhausting the stack, as it would happen with normal calls. This process is called tail
call optimization. Many functional programming languages such as Lisp, Scheme or Caml
implement tail call optimization very eciently, so that tail calls are as ecient as gotos
[Ste77].
As we will see in Section 7.5, the problem of immutable methods could be partly solved
by the presence of ecient tail calls. However, this is not the case for the current VMs:
 In the current implementations oftheCLI tail calls are tooslow to beused in practice.
In particular, on Microsoft CLR tail calls are about 10 times slower than normal calls,
while on Monothey are not even implemented correctly; in either case, they are orders
of magnitude slower than a simple goto, making the
tail.call
instruction unusable
for code that needs to be executed often.
 At the moment Java HotSpot does not support tail call optimization (see for example
[Sch09] for a description of a possible implementation).
4.4.1 Tail calls benchmark
Figure 4.1 shows the source code used to benchmark the eciency of tail calls. Both static
methods compute the sum of the rst n integers, the rst using a loop, the second using
tail recursion. Note that, although the code in the gure is written in C# for clarity, the
2
Acall is in tail position if it is immediately followed by a return instruction
29
public static int loop(int n)
{
int sum = 0;
while(n>0) {
sum += n;
n--;
}
return sum;
}
public static int tailcall(int n, int sum)
{
if (n < 0)
return sum;
// note: C# does not support the tail.call instruction
return tailcall(n-1, sum+n);
}
Figure 4.1: Tail call benchmark
language does not support the
tail.call
instruction, so we had to manually write the
algorithm directly in IL bytecode.
If tail call optimization is applied correctly, we would expect both versions to have about
the same performance. However, this is not the case: on Mono, the recursive version is
about 2.3 times slower than the loop, while on the CLR it is about 18.3 times slower.
Moreover, the Mono implementation of tail calls is known to be buggy[bug]: each tail call
leaks a bit of stack space, with the result that a deeply nested calls might result in a stack
over ow. As we will see in Section 8.5, this might trigger a crash in the code generated.
4.5 Primitive types vs reference types
Both the CLI and the JVM support values of primitive types and of reference types
3
:
 primitive types include numeric values, such as integers and  oating point numbers
of various sizes
 reference types include objects, that is, class instances
3
Actually, the CLI also supports value types, enumerations, generic types, etc., but they outside the
scope of this paragraph.
30
Although values of primitive types are not objects, it is possible to convert them through
the mechanism of boxing: for each primitive type, there is a corresponding boxed type
which wraps the value into a proper object. Once you have a boxed object, it is possible
to get its original value by unboxing it.
Unfortunately, arithmetic operations between boxed values are much slower than between
primitive values, due to the extra level of indirection and to the fact that it is necessary
to allocate a new object on the heap to hold every intermediate result. Thus, to get high
performance it is very important to use primitive types instead of boxed whenever it is
possible.
4.6 Delegates (or: object oriented function pointers)
In the CLI, a delegate is a special kind of object that wraps a method (either instance
or static): once created, the delegates can be freely stored and passed around, just as
normal objects. The only method exposed by delegates is
Invoke
,which calls the wrapped
method.
Delegates are type-safe: to instantiate one, we rst need to create a delegate type, i.e.
aclass which inherits from
System.MulticastDelegate
and species its exact signature.
Then, the VM can check that the signature of the delegate matches the signature of the
method being wrapped.
Moreover, it is possible to bind a delegate to an object, which will be automatically passed
as the rst argument to the method when the delegate is called. This is a limited form of
closure, which is usually exploited to create delegates that invokes an instance method on
aspecic object.
The JVM does not oer anything similar to delegates natively. However, it is possible to
implement them by using the classical Command design pattern [GHJV93], i.e. by dening
an interface for each signature we are interested in, and a class that implements it for each
method we want to invoke.
31
Documents you may be interested
Documents you may be interested