Econometria: copy and paste do Excel para RStudio
Licença
This work is licensed under the Creative Commons Attribution-ShareAlike 4.0 International License. To view a copy of this license, visit http://creativecommons.org/licenses/by-sa/4.0/ or send a letter to Creative Commons, PO Box 1866, Mountain View, CA 94042, USA.
Citação
Sugestão de citação: FIGUEIREDO, Adriano Marcos Rodrigues. Econometria: copy and paste do Excel para RStudio. Campo Grande-MS,Brasil: RStudio/Rpubs, 2020. Disponível em http://rpubs.com/amrofi/copy_paste e https://adrianofigueiredo.netlify.app/post/copy-paste/.
Script para reprodução (se utilizar, citar como acima)
Download 2020-08-18-econometria-copy-and-paste-do-excel-para-rstudio.pt.RmdIntrodução
Este material é um pequeno auxílio para trazer os dados do MS Excel para o RStudio fazendo copiar (control+C) e colar (control+V).
O exemplo parte da ideia de Souza (2015).
Procedimentos
A lógica do procedimento é colocar os dados na clipboard e depois puxar para o RStudio.
- Abra sua planilha em MS Excel contendo os dados organizados;
- Abra o RStudio no projeto de trabalho e abra um script;
- No MS Excel, copie (control+C) nos dados com rótulos;
YEAR | Y | X2 | X3 | X4 | X5 | X6 | lny | lnx2 | lnx3 | lnx4 | lnx5 | lnx6 | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|
1 | 1960 | 27.8 | 397.5 | 42.2 | 50.7 | 78.3 | 65.8 | 3.325036 | 5.985195 | 3.74242 | 3.925926 | 4.360548 | 4.18662 |
2 | 1961 | 29.9 | 413.3 | 38.1 | 52 | 79.2 | 66.9 | 3.397858 | 6.024174 | 3.640214 | 3.951244 | 4.371976 | 4.203199 |
3 | 1962 | 29.8 | 439.2 | 40.3 | 54 | 79.2 | 67.8 | 3.394508 | 6.084955 | 3.696351 | 3.988984 | 4.371976 | 4.216562 |
4 | 1963 | 30.8 | 459.7 | 39.5 | 55.3 | 79.2 | 69.6 | 3.427515 | 6.130574 | 3.676301 | 4.012773 | 4.371976 | 4.242765 |
5 | 1964 | 31.2 | 492.9 | 37.3 | 54.7 | 77.4 | 68.7 | 3.440418 | 6.200306 | 3.618993 | 4.001864 | 4.348987 | 4.229749 |
6 | 1965 | 33.3 | 528.6 | 38.1 | 63.7 | 80.2 | 73.6 | 3.505557 | 6.270232 | 3.640214 | 4.154185 | 4.384524 | 4.298645 |
7 | 1966 | 35.6 | 560.3 | 39.3 | 69.8 | 80.4 | 76.3 | 3.572346 | 6.328472 | 3.671225 | 4.245634 | 4.387014 | 4.334673 |
8 | 1967 | 36.4 | 624.6 | 37.8 | 65.9 | 83.9 | 77.2 | 3.594569 | 6.437111 | 3.632309 | 4.188138 | 4.429626 | 4.346399 |
9 | 1968 | 36.7 | 666.4 | 38.4 | 64.5 | 85.5 | 78.1 | 3.602777 | 6.50189 | 3.648057 | 4.166665 | 4.448516 | 4.35799 |
10 | 1969 | 38.4 | 717.8 | 40.1 | 70 | 93.7 | 84.7 | 3.648057 | 6.576191 | 3.691376 | 4.248495 | 4.540098 | 4.439116 |
11 | 1970 | 40.4 | 768.2 | 38.6 | 73.2 | 106.1 | 93.3 | 3.69883 | 6.64405 | 3.653252 | 4.293195 | 4.664382 | 4.53582 |
12 | 1971 | 40.3 | 843.3 | 39.8 | 67.8 | 104.8 | 89.7 | 3.696351 | 6.737323 | 3.683867 | 4.216562 | 4.652054 | 4.496471 |
13 | 1972 | 41.8 | 911.6 | 39.7 | 79.1 | 114 | 100.7 | 3.732896 | 6.815201 | 3.681351 | 4.370713 | 4.736198 | 4.612146 |
14 | 1973 | 40.4 | 931.1 | 52.1 | 95.4 | 124.1 | 113.5 | 3.69883 | 6.836367 | 3.953165 | 4.558079 | 4.821088 | 4.731803 |
15 | 1974 | 40.7 | 1021.5 | 48.9 | 94.2 | 127.6 | 115.3 | 3.706228 | 6.929027 | 3.889777 | 4.54542 | 4.8489 | 4.747537 |
16 | 1975 | 40.1 | 1165.9 | 58.3 | 123.5 | 142.9 | 136.7 | 3.691376 | 7.061249 | 4.065602 | 4.816241 | 4.962145 | 4.917789 |
17 | 1976 | 42.7 | 1349.6 | 57.9 | 129.9 | 143.6 | 139.2 | 3.754199 | 7.207564 | 4.058717 | 4.866765 | 4.967032 | 4.935912 |
18 | 1977 | 44.1 | 1449.4 | 56.5 | 117.6 | 139.2 | 132 | 3.78646 | 7.278905 | 4.034241 | 4.767289 | 4.935912 | 4.882802 |
19 | 1978 | 46.7 | 1575.5 | 63.7 | 130.9 | 165.5 | 132.1 | 3.843744 | 7.362328 | 4.154185 | 4.874434 | 5.108971 | 4.883559 |
20 | 1979 | 50.6 | 1759.1 | 61.6 | 129.8 | 203.3 | 154.4 | 3.923952 | 7.472558 | 4.120662 | 4.865995 | 5.314683 | 5.039547 |
21 | 1980 | 50.1 | 1994.2 | 58.9 | 128 | 219.6 | 174.9 | 3.914021 | 7.597998 | 4.075841 | 4.85203 | 5.391808 | 5.164214 |
22 | 1981 | 51.7 | 2258.1 | 66.4 | 141 | 221.6 | 180.8 | 3.945458 | 7.722279 | 4.195697 | 4.94876 | 5.400874 | 5.197391 |
23 | 1982 | 52.9 | 2478.7 | 70.4 | 168.2 | 232.6 | 189.4 | 3.968403 | 7.81549 | 4.254193 | 5.125154 | 5.44932 | 5.243861 |
- No script do RStudio, cole o código abaixo e execute após o ‘copiar’ do MS Excel:
dados <- read.table("clipboard", sep = "", header = TRUE, dec = ",", row.names = 1)
Ao rodar o script, o RStudio entenderá que deve pegar os dados do clipboard e colocar no objeto dados
. A opção sep
indica que os dados estão separados por tabulação (default do Excel); a opção header=TRUE
indica que o rótulo das colunas deve ser mantido; a opção dec=','
indica que os decimais estão separados por vírgula (comma separated values); a opção row.names=1
indica a coluna identificadora na planilha original. Como no presente caso não se tem coluna identificadora, deixa-se sem essa opção e ele numerará sequencialmente os dados. No caso, como a célula A1 está vazia, o RStudio entende que esta é a coluna identificadora. Portanto, executou-se abaixo:
Portanto, deve-se ter os dados no objeto dados e sua visualização é feita pela função View
ou no presente caso, print
. A função type.convert
instrui a conversão das colunas de dados de character
para double
(ou seja, numérico)
dados <- read.table("clipboard", sep = "", header = TRUE, dec = ",")
dados.convert <- type.convert(dados)
print(dados.convert[, 1:7])
YEAR Y X2 X3 X4 X5 X6
1 1960 27.8 397.5 42.2 50.7 78.3 65.8
2 1961 29.9 413.3 38.1 52.0 79.2 66.9
3 1962 29.8 439.2 40.3 54.0 79.2 67.8
4 1963 30.8 459.7 39.5 55.3 79.2 69.6
5 1964 31.2 492.9 37.3 54.7 77.4 68.7
6 1965 33.3 528.6 38.1 63.7 80.2 73.6
7 1966 35.6 560.3 39.3 69.8 80.4 76.3
8 1967 36.4 624.6 37.8 65.9 83.9 77.2
9 1968 36.7 666.4 38.4 64.5 85.5 78.1
10 1969 38.4 717.8 40.1 70.0 93.7 84.7
11 1970 40.4 768.2 38.6 73.2 106.1 93.3
12 1971 40.3 843.3 39.8 67.8 104.8 89.7
13 1972 41.8 911.6 39.7 79.1 114.0 100.7
14 1973 40.4 931.1 52.1 95.4 124.1 113.5
[ reached 'max' / getOption("max.print") -- omitted 9 rows ]
summary(dados.convert)
YEAR Y X2 X3
Min. :1960 Min. :27.80 Min. : 397.5 Min. :37.30
1st Qu.:1966 1st Qu.:34.45 1st Qu.: 544.5 1st Qu.:38.95
Median :1971 Median :40.30 Median : 843.3 Median :40.30
Mean :1971 Mean :39.67 Mean :1035.1 Mean :48.00
3rd Qu.:1976 3rd Qu.:43.40 3rd Qu.:1399.5 3rd Qu.:58.10
Max. :1982 Max. :52.90 Max. :2478.7 Max. :70.40
X4 X5 X6 lny
Min. : 50.7 Min. : 77.4 Min. : 65.80 Min. :3.325
1st Qu.: 64.1 1st Qu.: 80.3 1st Qu.: 74.95 1st Qu.:3.539
Median : 73.2 Median :106.1 Median : 93.30 Median :3.696
Mean : 90.4 Mean :124.4 Mean :107.86 Mean :3.664
3rd Qu.:125.8 3rd Qu.:143.2 3rd Qu.:134.40 3rd Qu.:3.770
Max. :168.2 Max. :232.6 Max. :189.40 Max. :3.968
lnx2 lnx3 lnx4 lnx5
Min. :5.985 Min. :3.619 Min. :3.926 Min. :4.349
1st Qu.:6.299 1st Qu.:3.662 1st Qu.:4.160 1st Qu.:4.386
Median :6.737 Median :3.696 Median :4.293 Median :4.664
Mean :6.783 Mean :3.847 Mean :4.434 Mean :4.751
3rd Qu.:7.243 3rd Qu.:4.062 3rd Qu.:4.834 3rd Qu.:4.965
Max. :7.815 Max. :4.254 Max. :5.125 Max. :5.449
lnx6
Min. :4.187
1st Qu.:4.317
Median :4.536
Mean :4.619
3rd Qu.:4.901
Max. :5.244
Referências
SOUZA, R.O. Copiando planilhas RStudio. RStudio, 2015. Disponível em: https://rpubs.com/ROGRO/69256. Acesso em 18.Ago.2020.