Econometria: copy and paste do Excel para RStudio

Licença

This work is licensed under the Creative Commons Attribution-ShareAlike 4.0 International License. To view a copy of this license, visit http://creativecommons.org/licenses/by-sa/4.0/ or send a letter to Creative Commons, PO Box 1866, Mountain View, CA 94042, USA.

License: CC BY-SA 4.0

Citação

Sugestão de citação: FIGUEIREDO, Adriano Marcos Rodrigues. Econometria: copy and paste do Excel para RStudio. Campo Grande-MS,Brasil: RStudio/Rpubs, 2020. Disponível em http://rpubs.com/amrofi/copy_paste e https://adrianofigueiredo.netlify.app/post/copy-paste/.

Script para reprodução (se utilizar, citar como acima)

Download 2020-08-18-econometria-copy-and-paste-do-excel-para-rstudio.pt.Rmd

Introdução

Este material é um pequeno auxílio para trazer os dados do MS Excel para o RStudio fazendo copiar (control+C) e colar (control+V).

O exemplo parte da ideia de Souza (2015).

Procedimentos

A lógica do procedimento é colocar os dados na clipboard e depois puxar para o RStudio.

  1. Abra sua planilha em MS Excel contendo os dados organizados;
  2. Abra o RStudio no projeto de trabalho e abra um script;
  3. No MS Excel, copie (control+C) nos dados com rótulos;
YEAR Y X2 X3 X4 X5 X6 lny lnx2 lnx3 lnx4 lnx5 lnx6
1 1960 27.8 397.5 42.2 50.7 78.3 65.8 3.325036 5.985195 3.74242 3.925926 4.360548 4.18662
2 1961 29.9 413.3 38.1 52 79.2 66.9 3.397858 6.024174 3.640214 3.951244 4.371976 4.203199
3 1962 29.8 439.2 40.3 54 79.2 67.8 3.394508 6.084955 3.696351 3.988984 4.371976 4.216562
4 1963 30.8 459.7 39.5 55.3 79.2 69.6 3.427515 6.130574 3.676301 4.012773 4.371976 4.242765
5 1964 31.2 492.9 37.3 54.7 77.4 68.7 3.440418 6.200306 3.618993 4.001864 4.348987 4.229749
6 1965 33.3 528.6 38.1 63.7 80.2 73.6 3.505557 6.270232 3.640214 4.154185 4.384524 4.298645
7 1966 35.6 560.3 39.3 69.8 80.4 76.3 3.572346 6.328472 3.671225 4.245634 4.387014 4.334673
8 1967 36.4 624.6 37.8 65.9 83.9 77.2 3.594569 6.437111 3.632309 4.188138 4.429626 4.346399
9 1968 36.7 666.4 38.4 64.5 85.5 78.1 3.602777 6.50189 3.648057 4.166665 4.448516 4.35799
10 1969 38.4 717.8 40.1 70 93.7 84.7 3.648057 6.576191 3.691376 4.248495 4.540098 4.439116
11 1970 40.4 768.2 38.6 73.2 106.1 93.3 3.69883 6.64405 3.653252 4.293195 4.664382 4.53582
12 1971 40.3 843.3 39.8 67.8 104.8 89.7 3.696351 6.737323 3.683867 4.216562 4.652054 4.496471
13 1972 41.8 911.6 39.7 79.1 114 100.7 3.732896 6.815201 3.681351 4.370713 4.736198 4.612146
14 1973 40.4 931.1 52.1 95.4 124.1 113.5 3.69883 6.836367 3.953165 4.558079 4.821088 4.731803
15 1974 40.7 1021.5 48.9 94.2 127.6 115.3 3.706228 6.929027 3.889777 4.54542 4.8489 4.747537
16 1975 40.1 1165.9 58.3 123.5 142.9 136.7 3.691376 7.061249 4.065602 4.816241 4.962145 4.917789
17 1976 42.7 1349.6 57.9 129.9 143.6 139.2 3.754199 7.207564 4.058717 4.866765 4.967032 4.935912
18 1977 44.1 1449.4 56.5 117.6 139.2 132 3.78646 7.278905 4.034241 4.767289 4.935912 4.882802
19 1978 46.7 1575.5 63.7 130.9 165.5 132.1 3.843744 7.362328 4.154185 4.874434 5.108971 4.883559
20 1979 50.6 1759.1 61.6 129.8 203.3 154.4 3.923952 7.472558 4.120662 4.865995 5.314683 5.039547
21 1980 50.1 1994.2 58.9 128 219.6 174.9 3.914021 7.597998 4.075841 4.85203 5.391808 5.164214
22 1981 51.7 2258.1 66.4 141 221.6 180.8 3.945458 7.722279 4.195697 4.94876 5.400874 5.197391
23 1982 52.9 2478.7 70.4 168.2 232.6 189.4 3.968403 7.81549 4.254193 5.125154 5.44932 5.243861
  1. No script do RStudio, cole o código abaixo e execute após o ‘copiar’ do MS Excel:
dados <- read.table("clipboard", sep = "", header = TRUE, dec = ",", row.names = 1)

Ao rodar o script, o RStudio entenderá que deve pegar os dados do clipboard e colocar no objeto dados. A opção sep indica que os dados estão separados por tabulação (default do Excel); a opção header=TRUE indica que o rótulo das colunas deve ser mantido; a opção dec=',' indica que os decimais estão separados por vírgula (comma separated values); a opção row.names=1 indica a coluna identificadora na planilha original. Como no presente caso não se tem coluna identificadora, deixa-se sem essa opção e ele numerará sequencialmente os dados. No caso, como a célula A1 está vazia, o RStudio entende que esta é a coluna identificadora. Portanto, executou-se abaixo:

Portanto, deve-se ter os dados no objeto dados e sua visualização é feita pela função View ou no presente caso, print. A função type.convert instrui a conversão das colunas de dados de character para double (ou seja, numérico)

dados <- read.table("clipboard", sep = "", header = TRUE, dec = ",")
dados.convert <- type.convert(dados)
print(dados.convert[, 1:7])
   YEAR    Y    X2   X3   X4    X5    X6
1  1960 27.8 397.5 42.2 50.7  78.3  65.8
2  1961 29.9 413.3 38.1 52.0  79.2  66.9
3  1962 29.8 439.2 40.3 54.0  79.2  67.8
4  1963 30.8 459.7 39.5 55.3  79.2  69.6
5  1964 31.2 492.9 37.3 54.7  77.4  68.7
6  1965 33.3 528.6 38.1 63.7  80.2  73.6
7  1966 35.6 560.3 39.3 69.8  80.4  76.3
8  1967 36.4 624.6 37.8 65.9  83.9  77.2
9  1968 36.7 666.4 38.4 64.5  85.5  78.1
10 1969 38.4 717.8 40.1 70.0  93.7  84.7
11 1970 40.4 768.2 38.6 73.2 106.1  93.3
12 1971 40.3 843.3 39.8 67.8 104.8  89.7
13 1972 41.8 911.6 39.7 79.1 114.0 100.7
14 1973 40.4 931.1 52.1 95.4 124.1 113.5
 [ reached 'max' / getOption("max.print") -- omitted 9 rows ]
summary(dados.convert)
      YEAR            Y               X2               X3       
 Min.   :1960   Min.   :27.80   Min.   : 397.5   Min.   :37.30  
 1st Qu.:1966   1st Qu.:34.45   1st Qu.: 544.5   1st Qu.:38.95  
 Median :1971   Median :40.30   Median : 843.3   Median :40.30  
 Mean   :1971   Mean   :39.67   Mean   :1035.1   Mean   :48.00  
 3rd Qu.:1976   3rd Qu.:43.40   3rd Qu.:1399.5   3rd Qu.:58.10  
 Max.   :1982   Max.   :52.90   Max.   :2478.7   Max.   :70.40  
       X4              X5              X6              lny       
 Min.   : 50.7   Min.   : 77.4   Min.   : 65.80   Min.   :3.325  
 1st Qu.: 64.1   1st Qu.: 80.3   1st Qu.: 74.95   1st Qu.:3.539  
 Median : 73.2   Median :106.1   Median : 93.30   Median :3.696  
 Mean   : 90.4   Mean   :124.4   Mean   :107.86   Mean   :3.664  
 3rd Qu.:125.8   3rd Qu.:143.2   3rd Qu.:134.40   3rd Qu.:3.770  
 Max.   :168.2   Max.   :232.6   Max.   :189.40   Max.   :3.968  
      lnx2            lnx3            lnx4            lnx5      
 Min.   :5.985   Min.   :3.619   Min.   :3.926   Min.   :4.349  
 1st Qu.:6.299   1st Qu.:3.662   1st Qu.:4.160   1st Qu.:4.386  
 Median :6.737   Median :3.696   Median :4.293   Median :4.664  
 Mean   :6.783   Mean   :3.847   Mean   :4.434   Mean   :4.751  
 3rd Qu.:7.243   3rd Qu.:4.062   3rd Qu.:4.834   3rd Qu.:4.965  
 Max.   :7.815   Max.   :4.254   Max.   :5.125   Max.   :5.449  
      lnx6      
 Min.   :4.187  
 1st Qu.:4.317  
 Median :4.536  
 Mean   :4.619  
 3rd Qu.:4.901  
 Max.   :5.244  

Referências

SOUZA, R.O. Copiando planilhas RStudio. RStudio, 2015. Disponível em: https://rpubs.com/ROGRO/69256. Acesso em 18.Ago.2020.

Avatar
Adriano M R Figueiredo
Professor of Regional Economics and Econometrics

My research interests include regional economics, econometrics, sustainable public policies and agricultural economics.

Related