“Coleta” ou “geração de dados”?
“Coleta de dados” ou “geração de dados?” Inicio esta reflexão com uma distinção fundamental para o pesquisador consciente. A escolha entre esses termos depende, diretamente, do paradigma científico adotado na sua área. Em alguns campos, especialmente nas abordagens mais críticas das ciências humanas, evita-se o termo “coleta”, pois este sugere que os dados estariam, simplesmente, “à espera”, já “prontos”, para serem coletados pelo pesquisador — uma concepção que contraria a compreensão de que os dados são, muitas vezes, construídos no próprio processo investigativo.
A influência do pesquisador
Em uma pesquisa, o pesquisador não simplesmente se aproxima dos dados, a fim de “coletá-los” e “analisá-lo”. Não é bem assim que o processo ocorre, pois aquele pode influenciar os dados com a sua própria presença. Como assim? Imagine questionários, dependendo da maneira pela qual estes foram realizados, abertos, estruturados, e da própria lógica apresentada, o pesquisador pode encontrar determinado tipo de resposta (ou não). A própria presença dele, reforçada por algumas perguntas que ele inconscientemente faça, pode gerar uma reação diferente no colaborador da pesquisa. Nesse sentido, o pesquisador pode influenciar os dados, porque ele pode gerar um impacto no colaborador, e, por essa razão, o colaborador pode ter outro tipo de resposta.
Objetividade versus subjetividade
A dita neutralidade científica e qualquer concepção mais rígida sobre a dita objetividade não mais vigoram em ciência, sejam exatas, humanas ou saúde. Alguns pesquisadores tentam, demonstrando a sua falta de humanização, se colocar nesse posicionamento, protegendo as aparências.
Mas isso é, apenas, “fachada” e, às vezes, estratégia de manipulação (e o contrário pode ocorrer também no caso da subjetividade; afinal, o ser humano, cientista ou não, independentemente de qualquer posicionamento, continua sendo o “ser humano”, não se enganem!).
Abra, como cientista, a sua cabeça para você não ter uma visão limitada de que a verdade se constitui dessa maneira. E se, como cientista, você se constitui com essas verdades, mesmo que você seja de um paradigma mais conservador, há um problema com o seu pensar e modo de fazer pesquisa.
A diversidade de dados
Há vários dados que podem ser utilizados em uma pesquisa. O uso destes depende do recorte temático e da complexidade da pesquisa. Você pode considerar documentos, gravação de áudios que serão transcritos para serem analisados, imagens (linguagem não verbal) vídeos, e vários outros elementos reveladores de sentido.
Você pode gerar ou coletar dados de forma coletiva — como em um grupo focal — ou individualmente, por meio de uma conversa gravada ou uma entrevista escrita. Há também a possibilidade de aplicar questionários, ampliando essa prática para diferentes contextos: ao longo do tempo, em ambientes físicos institucionalizados, espaços públicos ou plataformas virtuais.
Mas atenção: especialmente no meio acadêmico, há muitas críticas sobre o uso de ambientes virtuais para esse fim. Por isso, o rigor científico é indispensável — antes, durante e depois da coleta ou geração dos dados, garantindo que o processo seja ético, consistente e bem fundamentado.
Há pesquisadores que, simplesmente, não refletem sobre a questão ontológica e epistemológica do trabalho. Às vezes, as próprias citações do texto que apresentam na pesquisa, o TCC, Artigo, Dissertação ou Tese, não têm muito rigor; trazem citações descontextualizadas do Google, e as jogam no trabalho. Isso não é científico e revela uma debilidade intelectual e falta de zelo. Numa pesquisa, você pode consultar dados da internet para uma análise, por exemplo. Mas é preciso de rigor e lógica para justificar o que e como uma etapa é realizada.
Por exemplo, na minha pesquisa de mestrado, referente a um ambiente institucional, eu analisei um documento de lei ligado a este, disponibilizado, publicamente, no próprio site da instituição. Era um decreto. E eu também gerei dados com pessoas que transitavam, na época, nessa instituição, o Metrô-DF, e dependiam deste para garantirem o direito à cidade (Brasília e o Distrito Federal), por meio da mobilidade.
Considerações éticas para a geração ou coleta de dados
Continuando sobre a minha pesquisa… Durante a busca pelos dados, enfrentei muitas limitações em relação à autorização para poder realizar a pesquisa, e acabei pensando que, eticamente, não deveria, inclusive, abordar os colaboradores da pesquisa, aleatoriamente, no próprio Metrô-DF, em nome da “ciência”, enquanto se locomoviam, na correria do dia a dia, especialmente diante de minha perspectiva mais humanizadora como pesquisador.
Pensei, inicialmente, em realizar um grupo focal com uma duração determinada, mas logo percebi que seria complicado reunir um número significativo de pessoas diretamente nas estações de metrô. Isso poderia causar tumulto e interferir na mobilidade dos participantes. Por isso, busquei uma alternativa: encontrar, entre as pessoas com quem eu já convivia, possíveis colaboradoras para a minha pesquisa — usuárias do metrô. No entanto, essas pessoas também não eram tão próximas, o que, por sua vez, poderia influenciar os dados e o próprio processo de geração deles. Diante disso, considerei uma nova possibilidade: convidar estudantes de uma turma que lecionei durante o meu mestrado.
O tratamento com os dados: transcrição de áudios
Em determinado momento, é necessário que o pesquisador promova certo distanciamento em relação aos dados. Contudo, muitas pesquisas, atualmente, vão além dessa postura e exploram intensamente a subjetividade, trabalhando, por exemplo, com histórias de vida e outras abordagens semelhantes. Considero essas pesquisas super válidas, mas, sinceramente, não são as que mais me interessam. De todo modo, elas acabam se articulando com pesquisas de outra natureza, e, por fim, se complementam, permitindo aproximação da verdade em suas várias facetas.
Se você está trabalhando com áudios, entrevista gravada ou grupo focal, é interessante transcrevê-los e, minimamente, utilizar uma tabela de transcrição, como parte da metodologia, relativa à entonação no discurso e elementos muito além do dito verbal, reveladores de sentido e importantíssimos para a pesquisa. Há pesquisadores que, simplesmente, copiam, indiscriminadamente, os dados da pesquisa da maneira que ele acha que é. Há aspectos nas conversações que são relevantes, e muito mais complexos do que óbvios.
Abordagem científica para a transcrição de áudios
Imagine quando alguém realiza uma pausa muito prolongada na fala ou quando gagueja… ou quando a qualidade do áudio do material não é tão boa e o pesquisador não conseguiu transcrevê-lo. Nesses casos, é fundamental considerar simbologias que orientem a leitura e compreensão dos dados. Sem um planejamento lógico para a transcrição e sem o uso de uma tabela de conversão, há o risco de que os dados sejam alterados por interpretações equivocadas ou inconscientes sobre a realidade. Sem essa preparação, o processo perde o rigor necessário e deixa de ser científico.
Um exemplo para facilitar o entendimento: quando eu era adolescente, eu estudava inglês ouvindo música. Escolhia uma canção, esperava ela tocar no rádio e a gravava numa fita cassete (bons tempos). Depois, escutava a música repetidas vezes e tentava transcrever as letras para o papel — do jeito que eu achava que eram, influenciado pela minha língua materna.
Imagina o desastre que isso gerava! Mesmo assim, esse processo facilitou o desenvolvimento da minha compreensão oral do inglês (listening) e funcionou para a minha aprendizagem. Por outro lado, às vezes, eu reforçava meus próprios erros e acabava perdendo tempo, pois, naturalmente, distorcia o que ouvia, baseado na estrutura sonora da minha língua nativa — algo comum a qualquer pessoa nesse processo.
Depois, eu tentava cantar a música usando o que tinha copiado — ou seja, o que eu achava que tinha ouvido. Fazendo um paralelo, é como se fosse uma transcrição, mas completamente equivocada: sem segmentação, sem lógica alguma. Imagine o nível do meu inglês naquela época — fazia sentido apenas para mim (e para a minha irmã, de quem copiei essa tática rsrs). Apesar disso, era uma forma criativa e interessante de aprender, mas eu era um adolescente.
Seleção e organização dos dados para uma análise científica
Eu gosto muito desse exemplo, porque ele ilustra bem a importância de usar uma convenção para fazer as transcrições. É fundamental seguir alguma tabela de conversão para garantir rigor e consistência. Na minha dissertação, por exemplo, utilizei uma tabela específica que vocês podem consultar no meu site. Se alguém quiser indicação, posso ajudar com essa referência.
Outra questão importante é que você não conseguirá analisar todos os dados coletados. Por isso, é necessário pensar no recorte — escolher um conjunto de dados que represente a realidade com a qual você está trabalhando. Como pesquisador, você não pode abraçar o mundo inteiro nem dar conta de toda a complexidade da realidade. É preciso selecionar o que será analisado e focar no que é realmente relevante para o seu trabalho.
Também é importante ter cuidado com o material que você insere em anexo, seja documento, transcrição ou outro tipo de dado. Muitas pessoas simplesmente jogam tudo nessa seção, sem filtrar o que é pertinente, e acabam deixando o trabalho com um volume enorme de páginas que não acrescentam valor. Isso não é recomendável. O ideal é selecionar apenas o que for realmente relevante para evitar informações desnecessárias.
Pingback: A desculpa da Jurimetria no Direito | Anderson Hander – Revisor de Textos