O impacto do software livre na pesquisa científica
25 de Outubro de 2010, 0:00 - sem comentários aindaNa realização de pesquisa científica é comum existir a necessidade de realizar-se análises estatísticas, dois caminhos frequentemente adotados são a aquisição de softwares proprietários de alto custo e que nem sempre possuem bom desempenho, outro é o do uso ilegal destes sistemas, o que torna ilícita qualquer boa iniciativa. Neste trabalho serão apresentados diferentes soluções em código livre que podem não apenas apoiar o profissional nas análises estatísticas, mas melhorar sua performance em todo o método científico.
Para a captura dos dados através da internet, uma boa alternativa é o LimeSurvey é uma plataforma open-source, que permite a criação e gestão de pesquisas online, com uma boa performance para estudantes e pesquisadores científicos que, cada vez mais, utilizam plataformas online para obter resultados para os seus trabalhos de científicos. Com o LimeSurvey pode-se criar diversos tipos de pesquisas com função de multilinguagem, gerenciamento de usuários, criação de tokens, análises estatísticas iniciais com fácil exportação e de acordo com as normas do W3C. Dados capturados e digitados posteriormente, podem fazer uso do BrOffice Calc.
Para as análises estatísticas pode ser utilizado o “Project R”, que é uma poderosa ferramenta estatística para a realização de cálculos e geração de gráficos. Esta ferramenta já possui uma vasta base de usuários em sua comunidade e uma grande diversidade de pacotes disponíveis para download.
A integração entre o Limesurvey é “Project R” é algo muito importante, pois facilita a exportação destes dados por pesquisadores e estatísticos, que podem utilizar esta combinação simples para obter e tratar dados obtidos remotamente.
Para a escrita do documento científico, apresenta-se o LATEX como linguagem de marcação mais mais apropriada para esta finalidade. Com o uso do formato bibtex para a realização do referencial bibliográfico.
Será apresentado um estudo de caso, com a exportação dos dados no LimeSurvey, como os dados podem ser importados no R, e exemplos de como realizar análises no R de modo ágil e eficiente. Detalhando como algumas importantes análises estatísticas podem ser realizadas com o R, como analises de: normalidade, estacionariedade, representatividade das amostras, manipulação de gráficos, etc.
Ao final da palestra, participantes serão esclarecidos de que existem alternativas opensource por demais eficientes para a aplicações de pesquisa acadêmicas e de mercado. Todo o material elaborado para esta apresentação será disponibilizado para interessados durante o evento em licença Creative Commons.
Na realização de pesquisa científica é comum existir a necessidade de realizar-se análises estatísticas, dois caminhos frequentemente adotados são a aquisição de softwares proprietários de alto custo e que nem sempre possuem bom desempenho, outro é o do uso ilegal destes sistemas, o que torna ilícita qualquer boa iniciativa. Neste trabalho serão apresentados diferentes soluções em código livre que podem não apenas apoiar o profissional nas análises estatísticas, mas melhorar sua performance em todo o método científico.
Para a captura dos dados através da internet, uma boa alternativa é o LimeSurvey é uma plataforma open-source, que permite a criação e gestão de pesquisas online. Para as análises estatísticas pode ser utilizado o “Project R”, que é uma poderosa ferramenta estatística para a realização de cálculos e geração de gráficos. A integração entre o Limesurvey é “Project R” é algo muito importante, pois facilita a exportação destes dados por pesquisadores e estatísticos, que podem utilizar esta combinação simples para obter e tratar dados obtidos remotamente.
Para a escrita do documento científico, apresenta-se o LATEX como linguagem de marcação mais mais apropriada para esta finalidade. Com o uso do formato bibtex para a realização do referencial bibliográfico.
Ao final da estudo, participantes foram esclarecidos de que existem alternativas opensource por demais eficientes para a aplicações de pesquisa acadêmicas e de mercado. Todo o material elaborado para esta apresentação é disponibilizado para interessados durante o evento em licença Creative Commons.
Integração Project R e LATEX
1 de Julho de 2010, 0:00 - sem comentários aindaCaros,
estes dias precisei elaborar alguns relatórios estatísticos pesados com dezenas de gráficos, tabelas, matrizes e análises estatísticas,
foi nestes dias que descobri uma metodologia interessante para automatizar a produção destes gráficos.
A sacada vem com o uso de ferramentas consagradas de livre uso, LATEX (editoração de textos científicos) e Project R (ferramenta de análise estatística).
vou descrever o método para automatizar de forma simplificada:
01. Um documento é escrito em LATEX, mas salvo numa formato de texto comum (por exemplo .RNW, ), tags especiais indicam quando existe código R a ser executado, o código R inicia com "<<>>" e finaliza com um "@",
um exemplo deste código é apresentado abaixo:
<<echo=TRUE>>=
x <- c(1,2,3,4,5,6,7,8,9,10)
xm <- mean(x)
xm
@
Os comandos acima imprimem a média entre 1 e 10
02. Dentro do R, utiliza-se o pacote de tradução SWEAVE que transforma os comandos R num arquivo .TEX, basta ndo para isto chamar o comando sweave passando como parâmetro o nome do arquivo .RNW gerado (o pacote de tradução SWEAVE já vem instalado por default no R).
03. Em qualquer editor LATEX comum, WinEdit é um muito utilizado no windows, para o linux sugiro o Kile, pode ser realizada a geração do arquivo PDF, ou mesmo em outras extensões como RTF e HTML. Mas em minha experiência o formato RTF para abertura no Word ou mesmo no BrOffice não foi muito boa.
O aumento de produtividade com a automação da geração das análises estatísticas em conjunto com o documento final, permite que mudanças na base de dados da pesquisa não gere um imenso retrabalho, pois as análises são reexecutadas a cada tradução realizada no passo 02. De modo que a replicação das análises é feita de modo ágil e com o excelente padrão do LATEX.
Mais ajuda pode ser encontrada no seguinte referencial:
http://www.statistik.tuwien.ac.at/public/filz/students/SweaveExa.pdf
http://stat.epfl.ch/webdav/site/stat/shared/Regression/EPFL-Sweave-powerdot.pdf
Integração R com Limesurvey
3 de Maio de 2010, 0:00 - sem comentários aindaEste post destina-se para os companheiros que estão tendo problemas na integração do software estatístico R (Project R) com o limesurvey.
O Limesurvey tem uma boa integração com o R, e isto traz possibilidade muito interessantes no campo da análise estatística dos dados. Porém a documentação sobre esta integração não é lá digamos muito intuitiva...
Na ferramenta há uma breve orientação, como descrita abaixo:
-------------------------------------------------------------
Instruções para os impacientes
- Baixar os dados e o arquivo de sintaxe.
- Salvar os dois na pasta de trabalho R (usar getwd() e setwd() na janela de comando R para obter e definir).
- Digite na janela de comando: source("Surveydata_syntax.R")
Seus dados devem ser importados agora. O data.frame está nomeado "data", o variable.names são atributos de dados, como para read.spss{foreign}.
-------------------------------------------------------------
Se você era como eu, sem nenhuma base de R, provavelmente não vai seguir muito rápido com esta ajuda.
Assim, vou fazer uma explicação um pouco mais didática.
Primeiro é necessário fazer o download dos dois arquivos, e conforme orientação, devem ser postos na mesma pasta. O formato CSV contém os dados da pesquisa, já o R contém o script na própria sintaxe do R que preparará a importação.
No console do R (quando o R estiver pronto para receber comandos), deve ser alterado o caminho da pasta de trabalho do R, este será o local onde o R conseguirá enontrar os arquivos. Para setar o lugar utilize o comando a seguir.
setwd("informe dentro destas aspas o diretório onde os arquivos estão armazenados")
Para confirmar se a alteração foi realizada com sucesso, verifique através do comando:
getwd()
O novo diretório deve ser listado.
Utilize o comando abaixo para capturar os dados.
source("Surveydata_syntax.R")
Para verificar se os dados foram gravados corretamente, verifique o valor da matriz recebedora dos dados importados, chamando um comando com o mesmo nome da variável é "data".
data
Se tudo houver dado certo e dados forem plotados, os valores da tabela foram importados com sucesso, e os dados podem ser utilizados livremente.