Introdução
A promulgação da Lei Geral de Proteção de Dados (LGPD) promete afetar o funcionamento de todos os negócios que dependam do acesso de informações dos usuários no Brasil e o campo da inteligência artificial (IA) não se manterá alheio a isso. Assim, objetiva-se primeiramente traçar um breve panorama do funcionamento dessa tecnologia enfatizando sua dependência em dados. Logo em seguida serão apresentados alguns dos principais dispositivos da lei que podem afetar o campo da IA. Por fim, buscar-se-á apresentar potenciais soluções para o desenvolvimento desse campo de estudo.
O funcionamento da inteligência artificial
O campo da inteligência artificial vem mostrando considerável crescimento nos últimos tempos e promete ser uma das mais importantes tecnologias desenvolvidas pela humanidade pelos próximos 10 anos. Um relatóriorecente da Organização Mundial da Propriedade Intelectual (OMPI) revela que desde o surgimento desse campo de pesquisa, em 1950, cerca de 340 mil patentes foram pedidas e mais de 1,6 milhão de artigos foram publicados sobre o tema da inteligência artificial.
Dessas patentes, cerca de metade delas (aproximadamente 170 mil) tem sua origem a partir de 2013. E elas vêm de todos os tipos e tamanhos. Considerando que inteligência artificial se trata da “arte de criar máquinas que desempenhem funções que requeiram inteligência quando realizadas por pessoas”[1], qualquer aplicação de computador pode potencialmente ser considerada como uma de IA, contanto que seja capaz de resolver problemas os quais anteriormente somente a mente humana saberia responder. Como exemplos pode-se citar o sistema de classificação de músicas do Spotify, o método de tradução implementando pelo tradutor do Google e até mesmo a maneira que empresas como a Amazon indicam produtos aos seus consumidores.
E se os algoritmos de machine learning e deep learning desses aplicativos são os motores que possibilitam uma melhor indicação de músicas e produtos ou uma tradução mais precisa de uma língua para outra, são os dados que alimentam esses programas o combustível que permite ao sistema funcionar de maneira adequada. Isso se dá pelo fato de uma aplicação de inteligência artificial exigir três elementos para funcionar corretamente.
O primeiro deles é o seu algoritmo, o qual, implementado através de um programa de computador, é o que possibilita a execução de tarefas. Quanto mais complexo o algoritmo, maiores ou mais difíceis as atividades que ele pode executar. O segundo elemento é o computador, ou máquina, no qual esse programa vai ser executado. Dada a complexidade das aplicações de inteligência artificial, esse tipo de programa demanda um hardware com capacidade de processamento suficiente para executar suas funções com sucesso.
E o último desses elementos são os dados que alimentam os sistemas e os permitem produzir valores de saída condizentes com sua programação. Stuart Russell e Peter Norvig escrevem que durante o período de 60 anos de história da ciência da computação, de 1950 até aproximadamente 2010, portanto, a ênfase tinha sido no algoritmo como principal objeto de estudo. Eles afirmam, contudo, que para muitos problemas faria um sentido maior se preocupar mais com os dados coletados e ser menos criterioso sobre qual algoritmo aplicar. Isso se daria por conta da grande disponibilidade de bases de dados presentes na internet[2]. Assim, com base na pesquisa desses autores, uma aplicação de IA programada para desenhar quadros, por exemplo, produziria pinturas melhores quanto maior fosse o número de obras a que ela tivesse acesso anteriormente.
As limitações impostas pela Lei Geral de Proteção de Dados
E é na utilização dos dados que os problemas da inteligência artificial com a LGPD começam. Isso porque grande parte das aplicações do tipo existentes atualmente depende de uma forma ou de outra de dados coletados através da internet. Dos exemplos listados acima, tanto Spotify como Google e Amazon operam fundamentalmente a partir de um ambiente de rede. Esses serviços, e outros como carros autônomos e até mesmo o iFood, se valem dos inputs dos usuários, os quais são coletados através de sua conexão com a internet, analisados e utilizados, entre outros fins, para melhorar as funcionalidades de seus aplicativos.
Essa grande quantidade de inputs produzida por milhares de usuários dentro de um ambiente de rede é o que se denomina de Big Data, o qual pode ser definido como “representação de ativos de informação caracterizados por um volume, velocidade e variedade tão grandes que requerem uma tecnologia e métodos analíticos específicos para sua transformação em valor”[3]. Esses métodos analíticos específicos são supridos justamente pelos algoritmos de machine learning citados acima, os quais possibilitam transformar essa grande quantidade de informação em um resultado útil. Porém, a proteção desse tipo de dado gerado pelos usuários é o principal objeto da Lei 13.709/18, a LGPD. Por isso, cumpre agora analisar alguns dos principais dispositivos dessa lei e a maneira como eles podem afetar o funcionamento de aplicações de inteligência artificial no Brasil.
Primeiramente, o artigo 7º, inciso I, da LGPD prevê que o tratamento de dados pessoais somente poderá ser realizado mediante o fornecimento de consentimento pelo titular. O artigo 8º especifica que esse deverá ser fornecido por escrito ou por outro meio que demonstre a manifestação da vontade do titular, com o parágrafo 1º desse item prevendo a necessidade de a cláusula do consentimento estar destacada das demais cláusulas contratuais.
Isso significa que todo serviço fornecido por meio da internet que colete dados dos usuários deverá deixar isso bem explícito. Os famosos termos de uso com suas caixas de “Li e Aceito”, os quais são com frequência solenemente ignorados por internautas ávidos a explorar uma aplicação nova, não serão mais suficientes para demonstrar consentimento. Essa atividade de coleta deverá ser expressa separadamente, cabendo ao dono do aplicativo o ônus de provar a obtenção do consentimento, de acordo com o parágrafo 2º desse mesmo artigo 8º.
E esse termo de consentimento também não poderá ser genérico. O artigo 6º da LGPD estabelece dez princípios, além da boa-fé, que as atividades de tratamento de dados pessoais deverão observar. Desses, destacam-se três:
• finalidade: realização do tratamento para propósitos legítimos, específicos, explícitos e informados ao titular, sem possibilidade de tratamento posterior de forma incompatível com essas finalidades;
• adequação: compatibilidade do tratamento com as finalidades informadas ao titular, de acordo com o contexto do tratamento;
• necessidade: limitação do tratamento ao mínimo necessário para a realização de suas finalidades, com abrangência dos dados pertinentes, proporcionais e não excessivos em relação às finalidades do tratamento de dados.
Esses três primeiros princípios têm a função de garantir que somente as informações necessárias para um claro e específico fim serão coletadas do usuário. Isso porque há exemplos de empresas que coletam informações acerca da bateria, armazenamento e operadora dos usuários e até mesmo a posição do cursor na tela. Para qual finalidade uma rede social coletaria dados sobre a posição do mouse de um usuário de computador? Seria isso adequado para a atividade-fim da empresa e necessário para ela entregar um bom serviço?
Procurou-se demonstrar até aqui a dependência de algoritmos de IA na maior quantidade possível de dados disponíveis para poderem executar determinada função de maneira efetiva. Ainda que informações esparsas não tenham utilidade inerente em si, a análise de uma quantidade grande suficiente delas por meio de um programa avançado o suficiente pode levar aos resultados desejados pela empresa. Porém, esses nem sempre são compatíveis com o uso que os usuários fazem da plataforma.
Com a LGPD busca-se restringir o que é coletado ao estritamente necessário. Isso pode limitar a efetividade de aplicações de IA de empresas como Facebook e Google, as quais terão à sua disposição menos dados para alimentar seus programas, mas têm a capacidade de dar aos usuários maior controle sobre o que é acessado por essas plataformas. Elas agora deverão deixar explícito em termos de uso facilmente acessíveis pelos usuários que pretendem, por exemplo, saber o nível de bateria do celular, informação a qual talvez nem todos concordem em ceder.
Potenciais soluções para o desenvolvimento de aplicações de IA
É inegável que o uso de aplicações de IA, especialmente em um ambiente de rede, será afetado pela LGPD. Mesmo porque o descumprimento das obrigações estabelecidas por essa lei pode levar a multas de até R$ 50 milhões, de acordo com seu artigo 52. Por isso, uma das primeiras medidas a serem tomadas por operadores de programas do tipo deve ser atualizar seus termos de uso de modo a cumprir com o disposto em lei, deixando claro para o usuário o tipo de informação a ser coletada dele, bem como a finalidade desse uso.
Uma segunda medida é anonimizar os dados que venham a ser obtidos dos usuários. Isso significa, de acordo com o artigo 5º, inciso XI da LGPD, utilizar de meios técnicos razoáveis e disponíveis no momento do tratamento, por meio dos quais um dado perde a possibilidade de associação, direta ou indireta, a um indivíduo. Essa medida faz com que não seja mais pessoal e deixe de estar abarcado pelo escopo da lei, o que dá a ele possibilidades mais livres para ser tratado.
Por fim, sugere-se a utilização de bases de dados públicas, como essadisponibilizada pelo Google, para a condução de pesquisas e desenvolvimento de tecnologia na área de inteligência artificial. Várias das pesquisas nessa área vêm sendo realizadas no modelo open source, o que permite a todos os interessados terem acesso ao algoritmo base dos programas para desenvolverem seus próprios, a exemplo de iniciativas como o TensorFlow e o OpenAI. Além disso, o uso de programas e bases de dados públicos ameniza problemas nas áreas de propriedade intelectual e na proteção de dados pessoais, pois via de regra esse tipo de programa e de coletânea já conta com todas as licenças e autorizações necessárias para o uso livre.
Conclusão
Propôs-se com esse artigo elucidar alguns dos potenciais problemas que podem surgir da utilização de aplicações de inteligência artificial com o advento da LGPD. Longe de exaurir todo o tema, buscou-se enfatizar que o uso de dados por programas do tipo é um tema que deve ser olhado com atenção por profissionais atuantes na área, com o fim de evitar sanções pesadas. Ainda que a lei venha a limitar a coleta de dados para o uso nesses aplicativos, já há soluções e alternativas para se fazer um uso legal da tecnologia e garantir seu desenvolvimento.
________________________________________
[1] KURZWEIL, Ray. The Age of Intelligent Machines. MIT Press, 1990.
[2] RUSSELLL, Stuart; NORVING, Peter. Artificial Intelligence: A Modern Approach. 3. Ed. Harlow (UK): Pearson Education Limited, 2016.
[3] DE MAURO, Andrea; GRECO, Marco; GRIMALDI, Michele. A Formal definition of Big Data based on its essential Features. Library Review. 65: 122–135. doi:10.1108/LR-06-2015-0061, 2016.
Fonte: Conjur