display pdf winform c# : Rotate individual pages in pdf software Library dll winforms .net windows web forms 06%20-%20Zurini0-part72

Economy Informatics vol. 12, no. 1/2012 
65 
Format Conversions for Open Source Data Mining Implementation in 
Digital Economy Ranking 
Mădălina ZURINI
Academy of Economic Studies, Bucharest, Romania 
madalina.zurini@gmail.com  
The terms of digital economy and e-readiness are introduced and presented in the present 
area of evolution of economy stage within Europe and not only. The main aspects treated in 
the European University Institute ranking for e-readiness are briefly covered. An open source 
convertor  for  excel  to  arff  file  format  is  presented  and  used  in  the  purpose  of  input 
transformation  for  using  Weka  Data  Mining,  an  open  source  tool.  The  framework  of 
ExceltoArff tool is demonstrated in a practical use, the one of 70 countries registrations of 
EUI Ranking.    
Keywords: Conversion Process, Open Source, Digital Economy, Clustering Analysis, EUI 
2010 Ranking 
Digital economy ranking 
Knowledge  society  represents  a  new 
stage in human evolution, a superior quality 
lifestyle that involves intensive use of IT in 
all  spheres  of  human  activity,  with  major 
social  and  economic  changes.  Democracy, 
communication, 
understanding 
and 
cooperation  are  the  main  characteristics  of 
this society, which makes knowledge society 
to  be  based  on  the  multitude  resources 
offered by Internet access.  
Digital  economy  is  defined  in  [2]  by  the 
changing  characteristics  of  information, 
computing and communication, transforming 
it  into  the  driver  of  economic  growth  and 
social  change.  Since  1998,  the  US 
Department  of  Commerce  issued  The 
Emerging  Digital  Economy,  where  it  was 
recognized the accelerating importance of the 
Internet  and  e-commerce.  There  is 
considered to be a strong relation between e-
commerce  and  the  digital  economy  itself. 
Major studies  revealed  the  fact  that digital 
economy  is  widely  spread  within  e-
commerce.  
E-readiness, as seen in [1], is the ability of a 
country  to  use  information  and 
communication  technologies  in  order  to 
develop its economy. Starting from the need 
of measuring the level of e-readiness along 
the  countries  from  all  over  the  globe, 
UNPAN,  World  Bank  and  Economist 
Intelligence  Unit  first  calculated  macro 
indicators, called e-readiness indices, which 
helped in evaluating the impact given by ITC 
within a specific territory. 
Since  2000,  the  world’s  largest  economies 
were introduced in a global study regarding 
the impact given by the use of ITC upon the 
consumers, businesses and governments.  
In the EUI e-Readiness ranking, first called, 
later  Digital  Economy  Ranking,  over  100 
criteria,  qualitative  and  quantitative,  are 
evaluated  for  each country from  the  list  of 
70. Each criteria is scored, aggregated within 
every category defined, and also as o total, an 
average  given  as  a  whole.  The  categories 
available are: 
connectivity and technology infrastructure 
is  associated  to  the  need  of  reliable, 
convenient and affordable access to voice 
and data services; 
business  environment  is  the  ranking 
indicator  which  evaluates  the  general 
business climate; 
social  and  cultural  environment  is  the 
characteristic  analyzed  along  with  the 
connectivity, the access; 
legal  environment  refer  to  the  overall 
legal  framework  and  specific  laws 
regarding Internet use; 
government  policy  and  vision  is  the 
indicator for the evaluation of the overall 
government  area  and the ability of it to 
lead towards a digital future; 
Rotate individual pages in pdf - rotate PDF page permanently in C#.net, ASP.NET, MVC, Ajax, WinForms, WPF
Empower Users to Change the Rotation Angle of PDF File Page Using C#
pdf rotate single page and save; rotate one page in pdf
Rotate individual pages in pdf - VB.NET PDF Page Rotate Library: rotate PDF page permanently in vb.net, ASP.NET, MVC, Ajax, WinForms, WPF
PDF Document Page Rotation in Visual Basic .NET Class Application
how to save a pdf after rotating pages; how to reverse page order in pdf
66 
Economy Informatics vol. 12, no. 1/2012 
consumer  and  business  adoption  is  the 
indicator  which  refer  to  the  actual 
utilization  of  digital  channels by  people 
and the business companies. 
All data presented in the following report are 
extracted from the Digital economy ranking 
2010,  available  at  [5].  In  table  1,  the  six 
characteristics  with  which  70  countries  are 
being classified in EUI e-Readiness ranking, 
along with their subcategories are presented 
in  Table  1. For each subcategory and also 
category  a  weight  is  given  used  for  the 
ranking aggregation. 
Table 1. Categories and subcategories weights 
No. 
Category 
Subcategory 
Sub 
Weights 
Weights 
Connectivity 
and technology 
infrastructure 
Broadband penetration 
15% 
20% 
Broadband quality 
10% 
Broadband affordability 
10% 
Mobile-phone penetration 
15% 
Mobile quality 
10% 
Internet user penetration  
15% 
International Internet bandwidth 
10% 
Internet security 
15% 
Business 
environment 
Overall political environment 
11.1% 
15% 
Macroeconomic environment 
11.1% 
Market opportunities 
11.1% 
Policy towards private enterprise 
11.1% 
Foreign investment policy 
11.1% 
Foreign trade and exchange regimes  11.1% 
Tax regimes 
11.1% 
Financing  
11.1% 
Labor market  
11.1% 
Social and 
cultural 
environment 
Education level 
20% 
15% 
Internet literacy 
20% 
Degree of entrepreneurship 
20% 
Technical skills of workforce 
20% 
Degree of innovation 
20% 
Legal 
environment 
Effectiveness of traditional legal 
framework 
30% 
10% 
Laws covering the Internet 
25% 
Level of censorship 
10% 
Ease of registering a new business 
25% 
Electronic ID 
10% 
Government 
policy and 
vision 
Government spend on ICT 
5% 
15% 
Digital development strategy 
25% 
E-government strategy 
20% 
Online procurement 
5% 
Availability of online public services 
for citizens 
15% 
Availability of online public services 
for businesses 
15% 
E-participation 
15% 
VB.NET PDF Page Delete Library: remove PDF pages in vb.net, ASP.
doc.Save(outPutFilePath). How to VB.NET: Delete Consecutive Pages from PDF. doc.Save(outPutFilePath). How to VB.NET: Delete Specified Pages from PDF.
saving rotated pdf pages; change orientation of pdf page
VB.NET PDF Page Insert Library: insert pages into PDF file in vb.
Page: Insert PDF Pages. |. Home ›› XDoc.PDF ›› VB.NET PDF: Insert PDF Page. Add and Insert Multiple PDF Pages to PDF Document Using VB.
permanently rotate pdf pages; rotate pages in pdf expert
Economy Informatics vol. 12, no. 1/2012 
67 
No. 
Category 
Subcategory 
Sub 
Weights 
Weights 
Consumer and 
business 
adoption 
Consumer spending on ICT per head 
15% 
25% 
Level of e-business development 
10% 
Use of Internet by consumers 
25% 
Use of online public services by 
citizens 
25% 
Use of online public services by 
businesses 
25% 
The main objective of the present paper is to 
realize a classification and clustering analysis 
upon  the  digital  economy  ranking  without 
using  the  weights  for  the  principal 
characteristics used for ranking, meaning that 
the aggregation indicator is not applied  for 
the  clustering,  but  will  be  used  for  the 
validation of the new classification type.  
2 Excel to arff open source convertor 
In [6], the concept of open source software is 
defined  as  a  free  program  distributed  in 
which source code is open and visible and its 
main features are: 
free  distribution
restriction  is  not 
permitted by license; 
source code 
it should be included and 
open  to  a  product  distributed  through 
open source;   
changes made on these products can be 
made  and  the  resulting  programs  can 
themselves be distributed; 
the  integrity  of  the  author’s  code 
meaning that the product’s license shows 
clearly  whether  the  programs  resulting 
from changes can be distributed with the 
same  name  as  the  original  product  or 
not; 
lack of discrimination 
license does not 
discriminate  any  group  of  persons  or 
areas in which the product is intended to 
be used. 
Referring to the need to identify a correlation 
between the characteristics analyzed for the 
Digital Economy Ranking, and open source 
was needed to convert an excel file into an 
ARFF,  format  needed  for  the  data  mining 
analysis. This program is available at [7].  
The  ARFF,  Attribute-Relation  File  Format, 
presented  in  [8],  consists  in  the  following 
parts: 
header information; 
data information. 
The  header  information  part  contains  the 
name  of  the  relation,  the  list  of  attributes, 
along  with  their  type,  as  presented  in  the 
example below.  
@RELATION test 
@ATTRIBUTE attribute1 NUMERIC 
@ATTRIBUTE attribute2 {YES, NO} 
@ATTRIBUTE attribute3 DATE "yyyy-
MM-dd HH:mm:ss" 
For the data information, after the keyword 
@DATA, the list of data, the values accorded 
for each instance to the attributes described 
in the header part. The specific format is:  
@DATA 
13, YES, "2001-04-03 12:12:12" 
12, NO, "2001-05-03 12:59:55" 
In  order  to  form  an  ARFF,  using 
EXCELtoARFF  open  source,  the  file  path 
must be indicated, a .xls format. Loading the 
Data  Source,  in  the  left  side  of  the 
application, the data from the Excel specified 
sheet appears on the screen, as in Figure 1.
C# PDF Page Insert Library: insert pages into PDF file in C#.net
how to merge PDF document files by C# code, how to rotate PDF document page, how to delete PDF page using C# .NET, how to reorganize PDF document pages and how
rotate pages in pdf permanently; pdf rotate pages separately
C# PDF Page Delete Library: remove PDF pages in C#.net, ASP.NET
doc.Save(outPutFilePath); Demo Code: How to Delete Consecutive Pages from PDF in C#.NET. Demo Code: How to Delete Specified Pages from PDF in C#.NET.
rotate all pages in pdf preview; how to rotate pdf pages and save permanently
68 
Economy Informatics vol. 12, no. 1/2012 
Fig. 1. Excel data load 
The  next  step,  is  to  configure  the heading 
part from the ARFF file, this leading to the 
right side  of the framework  from figure 1. 
The  left  list  of  variables  are  the  variables 
named  in  the  excel  file,  list  that  is 
automatically  extracted,  as  each  column 
heading name. The right list is the list of the 
name  of attributes that  will  be used  in  the 
ARFF heading  part.  Clicking on a  variable 
name,  the  type  can  be  selected,  as  real  or 
string.  
In  Figure  2,  the  variable  Overall-score  is 
selected for configuration, choosing the real 
type,  and  automatically  named  Overall-
score|R|O,  a  standard 
prefix  used,  ‘|R|O’. 
Clicking on the Add button, the variables is 
set for the ARFF file. Each variable must be 
selected to be added in the ARFF file, along 
with its type.  
Fig. 2. Arff Header part configuration 
Last, selecting the name of the @relation, in 
our  case  ‘EUIranking’,  the  Convert  button 
can be clicked, generating, in the bottom part 
of  the  window,  the  ARFF  file.  In  the 
meantime, it can be saved at a specific path, 
choosing the button right from the Convert 
one. The header and data parts generated are 
presented in Figure 3.  
C# TIFF: How to Rotate TIFF Using C# Code in .NET Imaging
Individual Products. XDoc.SDK for .NET. XImage.SDK for Page. |. Home ›› XDoc.Tiff ›› C# Tiff: Rotate Tiff Page. & pages edit, C#.NET PDF pages extract, copy
how to rotate one page in a pdf file; rotate pdf pages and save
VB.NET PDF - WPF PDF Viewer for VB.NET Program
Individual Products. XDoc.SDK for .NET. XImage.SDK for .NET. Page: Replace PDF Pages. Page: Move Page Position. Page: Copy, Paste PDF Pages. Page: Rotate a PDF
rotate pages in pdf and save; how to rotate all pages in pdf
Economy Informatics vol. 12, no. 1/2012 
69 
Fig. 3. Arff file Convert 
This  conversion  is  done  with  no  loose  of 
information.  The  difference  between  the 
excel file and the arff one, is the one given by 
the specific header that the ARFF needs in 
order to determine the meaning of the data 
that  follows  it.  The  new  file  format 
generated,  the  next  step,  the  one  of  data 
mining process, is done using another open 
source  tool,  Weka  Data  Mining,  tool 
presented in the next chapter.  
3 Weka Data Mining open source tool 
Weka, Waikato Environment for Knowledge 
Analysis,  is  a  suite  of  machine  learning 
software,  developed  by  University  of 
Waikato,  New  Zeeland,  with  the  website 
[10].  The  available  operations  that  can  be 
achieved in Weka open source tool are: 
preprocessing phase; 
data classification; 
data clustering; 
association rules; 
attribute selection; 
data visualization. 
In the present section, all 6 phases available 
within Weka software are illustrated with the 
data  generated by ExceltoArff convertor, the 
ARFF file containing six characteristics for 
each 70 countries analyzed. For the first step, 
the preprocess one, data must be indicated, 
meaning  the  ARFF  file  containing  the 
relation,  attributes  description  and  data 
information. Figure 4 reveals the preprocess 
step, after inserting the path file for Digital 
Economy Ranking data file.  
C# PDF Page Extract Library: copy, paste, cut PDF pages in C#.net
C#.NET PDF Library - Copy and Paste PDF Pages in C#.NET. Easy to C#.NET Sample Code: Copy and Paste PDF Pages Using C#.NET. C# programming
rotate pdf pages in reader; pdf rotate page and save
C# PDF Library SDK to view, edit, convert, process PDF file for C#
load, create, convert and edit PDF document (pages) in C# other file formats; merge, append, and split PDF files; insert, delete, move, rotate, copy and
how to rotate just one page in pdf; rotate pdf page and save
70 
Economy Informatics vol. 12, no. 1/2012 
Fig. 4. Preprocessing phase 
For  a  deeper  view,  Figure  5  contains  the 
statistic  indicators  calculated  for  each 
characteristic.  The  minimum  value  for 
connectivity  is  situated  for  Nigeria,  62th 
place,  while  the  maximum  value  of  8.2  is 
pointed for Sweden, the country situated in 
the  first  place.  The  mean  value  of  the  70 
countries is 5.1, with a standard deviation of 
1.964. 
Fig. 5. Statistic information for connectivity characteristic 
Other information available in figure 4 is the 
one relating the attribute type, name, as: 
name, the name of the attribute selected; 
type, the attribute type, that can be real, 
string; 
missing,  the  percentage  of  missing 
values of the specific attribute; 
distinct,  the  number  of  distinct  values 
that attribute analyzed has; 
unique,  the  number  and  percentage  of 
instances in the data having a value for 
this  attribute  that  no  other  instances 
have. 
The filter section allows working with filters 
upon the data, already created filters, or ones 
implemented  by  the  users.  The  types  of 
filters available are: 
supervised; 
unsupervised. 
The supervised filters are also divided into: 
attribute  filters,  such  as  add 
classification, 
attribute 
selection, 
nominal to binary; 
instance  filters,  like  stratified  remove 
folds. 
For  the  unsupervised  filters,  attribute  and 
instances are  available  to.  For  the  attribute 
type are present: 
add, add expression, add id, add noise, 
add values; 
center; 
copy; 
discrete; 
nominal to binary; 
Economy Informatics vol. 12, no. 1/2012 
71 
nominal to string; 
kernel; 
reorder; 
standardize. 
When it comes to unsupervised filters for the 
instances, the following types occur: 
remove folds; 
normalize; 
randomize; 
resample; 
remove range; 
remove percentage. 
The  filters  being  applied,  we  move  to  the 
clustering zone, presented in Figure 6. 
Fig. 6. Clustering analyses in Weka 
First,  a  cluster  type  is  chosen,  from  the 
available list: 
Farthest First; 
Filtered Clustered; 
Hierarchical; 
Simple k Means; 
X Means. 
A  selection  of  attributes  ignoring  can  be 
applied.  The  output  of  the  clustering 
contains: 
the number of iterations needed for the 
clustering process; 
the sum of squared errors within cluster; 
clusters centroids; 
percentage  of  instances  associated  to 
each cluster. 
For each relation between the characteristics 
available, a 2D graphic is formed, for the X 
axis  a  characteristic,  and  for  the  Y  axis 
another  chosen  characteristic.  Each  point 
from  this  XOY  space  has  different  colors, 
indicating the membership to its cluster, as in 
Figure 7. 
Fig. 7. Two attribute clustering membership 
72 
Economy Informatics vol. 12, no. 1/2012 
Attribute  selection Weka components deals 
with principal components analysis, analysis 
done  in  order  to  minimize  the  redundancy 
among the information within the instances 
from the relation. For the example of Digital 
Economy  Ranking,  the  six  characteristics 
saved  are  transformed  with  3  new  vectors 
used  for  information  explanation,  ranked 
attributes.  A  transformation  expression  is 
generated  for  attribute  to  eigenvectors 
conversion, with as less as possible loose of 
information, but with a lowering in the total 
dimension  of  data.  In  Figure  8,  the 
eigenvectors generated are available.  
Fig. 8. Weka principal components stage 
As for the last phase, the visualization offers 
a 2D spatial representation of the interaction 
between the attributes analyzed, Figure 9.  
Fig. 9. Weka visualization stage 
The advantages given by Weka open source 
include, as seen in [9]: 
freely  available  under  GNU  General 
Public License; 
portability; 
Economy Informatics vol. 12, no. 1/2012 
73 
a  collection  of  data  preprocessing  and 
modeling techniques; 
graphical user interfaces. 
4 Implementation results 
For an in-depth documentary concerning the 
suitable spatial models used in the process of 
classification, a brief overview of the main 
methods used in literature is done. Clustering 
analysis is the method used in data mining, 
information retrieval, pattern recognition and 
is  a  spatial  representation  model  that  is 
defined as an assignment of a set of objects 
into  smaller subsets,  called clusters, by the 
similarity between the objects from the same 
cluster  and  the  differences  among  the 
clusters. 
Applying the k-means for the 70 registrations 
with the 6 characteristics, with a number of 
three  clusters,  the  following  centroids 
resulted  from  Figure  10.  Cluster  1  is 
associated to the first 24 countries, cluster 2 
is for the next 17 countries, while cluster 0 is 
formed out of the last 29 countries. 
Fig. 10. Cluster's centroids for k-means algorithm 
For  a  correlation  example  between  two 
categories  used  for  the  present  ranking, 
business  environment,  OX  axis,  and  social 
and cultural environment, OY axis, is formed 
in the graphic from Figure 11. 
Fig. 11. Two characteristics clustering correlation 
The following analyze is done using first the 
method  of principal  components extraction, 
called eigenvalues, from the six classification 
available.  Table  2  contains  the  cumulative 
percentage  of  information  gathered  in  the 
characteristics.  
74 
Economy Informatics vol. 12, no. 1/2012 
Table 1. Eigenvalues  
Selecting the first two eigenvalues, the next 
2D  diagram  includes  the  70  countries  and 
total  information  of  93.48%  from the  total 
one  obtained  within  the  six  characteristics 
analyzed.  
Fig. 12. Two eigenvalues graphic 
It can be seen that, if only the first 2 new 
dimensions are selected, a percentage of 93 
from the total information is condensed in a 
2D  plan.  The  correlation  within  the  six 
characteristics is revealed in Table 3. 
Table 2. Correlation matrix 
For  the  most  correlated  elements,  the 
consumer and business adoption  and social 
and  cultural  environment,  a  regression  is 
formed in Figure 13.  
Documents you may be interested
Documents you may be interested