Os humanos por trás da inteligência artificial

Para muitas pessoas, “IA” evoca visões de ficção científica de robôs autônomos – às vezes amigáveis, muitas vezes hostis. Enquanto isso, para cientistas e engenheiros, a IA é vista de forma mais concreta: como matrizes de GPUs executando redes neurais complexas de várias camadas.

Ambas as perspectivas tendem a ignorar o fato de que – assim como com a manufatura tradicional – os projetos de IA de hoje estão sendo construídos em grande parte usando trabalho manual antiquado.

Um

Qin Jiao, 30, recentemente deixou seu emprego em um call center para se juntar às crescentes fileiras de trabalhadores empregados em empresas de “processamento de dados” de apoio à IA. A tarefa de Jiao é rotular manualmente fotos, vídeos e dados de voz.

Os dados rotulados serão usados ​​por empresas de tecnologia para treinar algoritmos e modelos de IA nas áreas de reconhecimento de imagem, reconhecimento de voz e várias outras aplicações. De modo geral, quanto maior o conjunto de dados de dados rotulados com precisão, melhor será o desempenho e o produto.

Um trabalhador qualificado como Jiao pode processar até 40 imagens por dia, desde que ela precise apenas de objetos de moldura, categorias de rótulos e fornecer algum contexto. No entanto, se as imagens de um edifício, por exemplo, incluem detalhes arquitetônicos complexos, a produção de etiquetas de um trabalhador pode cair para 10 fotos por dia.

O último pedido de Jiao envolve a rotulagem de 60.000 fotos em uma semana. Normalmente, entregar um pedido desse volume exigiria mais de 200 pessoas trabalhando por sete dias, mas a equipe de Jiao conta com menos de 100, alguns dos quais têm outros projetos para lidar.

“É melhor eu morrer na hora”, suspira Jiao, “diante de entregar o que me pedem.”

Mesmo um conjunto de 60.000 imagens parece pequeno quando comparado ao ImageNet, que tem 15 milhões de imagens anotadas. Devido ao seu tamanho e acesso de código aberto, ImageNet rapidamente se tornou a primeira escolha para pesquisa de reconhecimento de imagem. Pesquisadores importantes como Andrew Ng e Jeff Dean o usaram.

Mas o ImageNet tem seus próprios pontos fracos – grandes caixas de rótulos, poucos tipos de rótulos e uma alta taxa de erro – o que o torna indesejável para modelos de algoritmos de treinamento.

As empresas de IA exigem dados precisos para aplicações especializadas, e coisas aparentemente pequenas, como rotulagem e marcação, exigem precisão. No momento, apenas humanos estão preparados para a tarefa.

Para muitas start-ups que recrutam engenheiros, “a capacidade de coletar e rotular dados” agora é um pré-requisito. A capacidade de obter dados rotulados de alta qualidade desempenha um papel fundamental na determinação da competitividade de uma empresa.

Dois

Antes do surgimento das empresas de rotulagem de dados profissionais, as plataformas de crowdsourcing eram uma solução de baixo custo para a crescente demanda por dados do mercado de IA. Uma conhecida plataforma de crowdsourcing de dados afirma ter mais de 5.000 especialistas em rotulagem de dados, capazes de lidar com mais de 2 milhões de imagens por dia. O serviço é garantido para “fornecer boa qualidade”. Mas isso é confiável?

Com o grande número de pessoas participando do crowdsourcing, a capacidade varia naturalmente. Essa variação cria erros e, quando há muitos erros, um conjunto de dados simplesmente não pode ser usado.

A compra de conjuntos de dados rotulados por meio de plataformas de troca de dados é outra opção. Mas o problema de personalização permanece, já que diferentes aplicativos de IA exigem diferentes conjuntos de dados e métodos de rotulagem.

As empresas de IA não podem rotular tudo sozinhas, e as plataformas de crowdsource não podem passar pelo controle de qualidade. Foi isso que deu origem a empresas de rotulagem de dados especializadas, como a Jiao’s, que visa a demanda do mercado por grandes conjuntos de dados personalizados com qualidade garantida.

“A nossa é a única empresa da região especializada em processamento de dados refinado”, diz Jiao com orgulho.

Os funcionários são divididos em diferentes grupos de projetos. Alguns podem ser responsáveis ​​por rotular nódulos no corpo humano em posturas complexas de ioga; enquanto outros rotulam motocicletas, bicicletas e pedestres e identificam direções de viagem de veículos para treinar modelos de algoritmo para câmeras de vigilância de rua. Outros podem escanear os contornos de edifícios ou objetos obscuros, usados ​​para treinar o radar para detectar objetos do mundo real.

Outros funcionários são responsáveis ​​pelos vídeos, extraindo frames e rotulando a direção e as alterações de cada objeto nos frames subsequentes. Esses dados podem ser usados ​​para treinar a percepção de movimento ou prever a mudança projetada de localizações de objetos.

Esses conjuntos de dados são cruciais na corrida da indústria de IA para lançar novos produtos, melhorar a precisão de funções específicas e a confiabilidade dos produtos com base nessa função e estimular o crescimento e o financiamento da empresa.

Três

As novas empresas de processamento de dados estão localizadas em uma “cidade digital” tranquila e dedicada, nas montanhas, a cerca de 50 quilômetros da cidade de Guiyang.

Perto da cidade, há uma pequena faculdade profissionalizante, que treina a maioria dos funcionários da empresa de Jiao. O objetivo inicial dessas escolas profissionalizantes era educar os menos favorecidos – a maioria das crianças vem de famílias pobres e as escolas fornecem subsídios e bolsas de estudos. Os alunos também podem trabalhar cerca de seis horas por dia, o trabalho se tornando um trampolim para ajudá-los a ir para outro lugar.

Os corredores da escola estão repletos de lembretes das condições anteriores dos alunos – incluindo pobreza, pais perdidos e deficiências físicas. Estes são combinados com histórias de como os alunos foram capazes de mudar o destino de sua família.

“Nossos alunos são particularmente trabalhadores e os pés no chão, alguns acabam fazendo estágios em Pequim”, diz Jiao. “Os feedbacks dos empregadores nos dizem que eles superam os alunos de graduação de Pequim.”

O COO da empresa, Li Zheng, também fala positivamente sobre o que esses empregos significam para os estudantes locais. No entanto, ele está preocupado com as perspectivas futuras da indústria. Ex-graduado pela Universidade de Aeronáutica e Astronáutica de Pequim, Zheng sabe que a atual indústria de rotulagem de dados exige muita mão de obra e não é muito diferente das fábricas de manufatura do sul da China. Os alunos fazem parte de uma linha de montagem, na base da cadeia de valor. Ele acredita que a empresa precisa encontrar um modelo de negócios melhor para ajudar os alunos a progredir em suas carreiras.

Com isso em mente, Zheng expandiu os negócios de sua empresa para cobrir a coleta de dados. Isso envolve tirar fotos de retratos de vários ângulos de modelos em várias posturas. Essas fotos treinarão os computadores para reconhecer e processar diferentes perspectivas, o que é útil em aplicativos de reconhecimento facial.

A empresa já concluiu vários pedidos de clientes em seu estúdio fotográfico construído por conta própria. E, é claro, os alunos são usados ​​para os retratos. Eles fazem fila fora do estúdio, tiram fotos e, em seguida, colocam máscaras, óculos de sol e chapéus para mais fotos. Um conjunto de fotos compreende 10 imagens e 100 conjuntos são produzidos por dia. Para empresas de segurança acostumadas a tirar suas próprias fotos, esses conjuntos de fotos embalados (com pelo menos mil alunos) são de fato produtos muito competitivos no mercado.

A empresa também faz trabalhos de tradução para um segundo idioma, o que reduz a necessidade de intérpretes locais quando viajantes a negócios visitam o sudeste da Ásia, por exemplo.

“Estamos treinando uma série de funcionários na tecnologia, para que possamos atender melhor às necessidades de nossos clientes.” diz Zheng.

Quatro

“Rotular é um trabalho realmente difícil”, diz o cientista-chefe da UniDT Technology Yi Xiangzhi, que não consegue deixar de franzir os lábios quando questionado sobre a tarefa.

A UniDT recentemente sediou uma competição de aplicativos de big data em que os concorrentes foram convidados a criar programas que pudessem identificar imagens de animais ou ajudar câmeras de segurança de veículos a rastrear acidentes.

Um teste pediu aos concorrentes que “calculassem a taxa de ocupação das prateleiras de um produto por meio de fotos”. Os participantes tiraram mais de 1.600 fotos de prateleiras reais como dados brutos.

O objetivo da competição era encorajar o uso de conjuntos de dados menores, de preferência menos de dois mil, para concluir uma tarefa de reconhecimento de imagem.

“O maior problema do aprendizado profundo é o tamanho da amostra de dados. O desafio está em ensinar a máquina a aprender com conjuntos de dados menores ”, diz Xiangzhi. A modelagem de imagem aprimorada pode ser usada para reduzir erros.

Mas criar etiquetas precisas não é uma tarefa fácil, considerando que leva 12 pessoas meio mês para processar 1.000 fotos. A quantidade de trabalho incrivelmente monótono é suficiente para enlouquecer alguns pesquisadores de rotulagem. Mesmo se houver um número suficiente de pessoas capazes de rotular de acordo com os padrões, a rotulagem de dados é uma indústria com sustentabilidade de longo prazo?

Com relação ao valor da rotulagem de dados, os membros do setor parecem ter opiniões divergentes. Alguns veem a Internet como o maior conjunto de dados que temos, mesmo que esses dados não possam ser usados ​​diretamente. Alguns dizem que precisam de mais estagiários ou funcionários para rotular os dados. Algumas empresas criaram seus próprios departamentos de rotulagem de dados, enquanto outras acreditam que a terceirização não é problema se os canais certos forem usados.

Cinco

Em resposta à pergunta “Há pessoas em grandes empresas responsáveis ​​por rotular os dados?” no Zhihu.com (a versão chinesa do Quora), esses funcionários comentaram que se tratava de uma “guerra de rotulagem com trabalho intensivo” ou “trabalho terceirizado para lugares mais baratos”. Funcionários de empresas menores, por sua vez, disseram que as tarefas de etiquetagem eram feitas por um “departamento exclusivamente feminino” ou “feitas por nós mesmos”. No geral, “terceirização” foi a resposta mais comum.

Os sites de recrutamento de empregos contam uma história semelhante. Uma pesquisa por “rotulagem de dados” retorna até 400 postagens diretamente relacionadas, muitas de empresas terceirizadas.

Com inúmeras startups fervilhando para desenvolver seus próprios aplicativos de IA, começar uma empresa de etiquetagem de dados parece um bom plano de negócios.

Em 2009, o diretor Zhang Tonghe filmou trabalhadores migrantes da linha de montagem para seu documentário “Working Girls”. Alguns tinham acabado de fazer 18 anos, enquanto outros eram ainda mais jovens. Muitos pareciam não entender qual era seu trabalho e não tinham ideia de que o chamado “QC” de que falaram significava “controle de qualidade”. As condições de vida eram extremamente difíceis, e mesmo sair para comer lanches tarde da noite era considerado um luxo.

Nenhuma das meninas planejou ficar e muitas tinham objetivos de carreira claros. Para tanto, estavam dispostos a dividir quartos com outras 15 pessoas e banheiros com outras 50. Objetivos como receber uma entrada para suas próprias vagas, avançar para posições melhores e fazer aulas de computador ou inglês nos finais de semana ocupavam suas mentes.

Aparentemente, essas jovens interpretaram a teoria da alienação de Marx de uma maneira nova: não se tratava de derivar um senso pessoal de realização no trabalho. Em vez disso, eles se concentraram em como a vida avança, como seu dinheiro arduamente ganho foi orçado, as habilidades adquiridas ao longo do caminho e quem eles esperavam que pudessem se tornar.

“Os dados rotulados estão em alta demanda”, diz Xiangzhi, “mas a indústria tem apenas cinco anos restantes, porque todos estão procurando soluções como código-fonte aberto ou aprendizado de pequenas amostras.”

Talvez, antes de nos preocuparmos com as perspectivas futuras do setor, pudéssemos considerar se o valor que ele está trazendo agora para as pessoas que fazem o trabalho é suficiente por si só.

Sim, a IA exige muita mão de obra, assim como outros esforços sociais coletivos de grande escala. E as pessoas que rotulam os dados não são diferentes de outros trabalhadores manuais que trabalham duro – são os rostos que encontramos em qualquer multidão.

Artigos originais da China sincronizada: http://www.jiqizhixin.com/article/2594 | Autores: Miaomiao Yu | Editores: Meghan Han, Michael Sarazen