Os chatbots podem se tornar tão conscientes quanto os humanos?
Miscelânea / / October 31, 2023
Duas teorias opostas tentam responder a esta questão.
Christoph Koch
Neurocientista americano, diretor do Allen Institute for Brain Research.
Perguntas sobre o que é a experiência subjetiva, quem a possui e como ela se relaciona com o mundo físico que nos rodeia têm assombrado as mentes dos filósofos durante a maior parte da história humana. No entanto, as teorias científicas da consciência que são quantificáveis e empiricamente testáveis surgiram apenas nas últimas décadas.
Muitas teorias modernas da consciência concentram-se nos traços deixados pelas finas redes celulares do cérebro, das quais surge a consciência. Hoje, duas delas dominam: a teoria da informação integrada e a teoria do espaço de trabalho global neural.
Há vinte e cinco anos tivemos uma discussão com o filósofo australiano David Chalmers. Prometi-lhe uma caixa de bom vinho se esses traços neurais, tecnicamente chamados de correlatos neurais da consciência, fossem descobertos e claramente descritos até junho de 2023.
No entanto, a contradição entre a teoria da informação integrada e a teoria do espaço de trabalho global neural permanece sem solução. Isto se deve a evidências parcialmente contraditórias sobre quais áreas do cérebro são responsáveis pela experiência visual e percepção subjetiva de rostos ou objetos, embora a importância do córtex pré-frontal para a experiência consciente tenha sido refutado. Então perdi a aposta e mandei o vinho para Chalmers.
Ambas as teorias dominantes foram criadas para explicar a conexão entre a consciência e a atividade neural em humanos e animais relacionados, como macacos e ratos. E ambas as teorias fazem suposições fundamentalmente diferentes sobre a experiência subjetiva e chegam a conclusões opostas sobre a consciência em artefatos artificiais. Até que ponto essas teorias são empiricamente confirmadas ou refutadas em relação à consciência enraizada na cérebro, tem implicações importantes para responder à questão não resolvida do nosso tempo: as máquinas podem ganhar consciência?
O que são chatbots de nova geração?
Antes de discutirmos isso, deixe-me contextualizá-lo e comparar uma técnica que é consciente com uma técnica que exibe apenas comportamento inteligente. Os engenheiros da computação se esforçam para dotar as máquinas da inteligência altamente flexível que antes permitia pessoa deixar a África e povoar todo o planeta. Isso é chamado de inteligência artificial geral (AGI).
Muitos argumentam que a AGI é uma perspectiva distante. O incrível progresso alcançado no campo da inteligência artificial no ano passado pegou o mundo inteiro, incluindo os especialistas, de surpresa. Com o advento de aplicativos de software conversacionais eloquentes, coloquialmente chamados de chatbots, de um tema esotérico, discutidas pelos fãs de ficção científica e pela elite da indústria de TI do Vale do Silício, as discussões sobre AGI se transformaram em uma discussão em que reflecte o descontentamento público generalizado sobre o risco existencial para o nosso modo de vida e para a nossa tipo.
Os chatbots são baseados em enormes modelos de linguagem. O mais famoso deles é uma série de bots chamados transformadores generativos pré-treinados, ou GPTs. Eles foram criados pela OpenAI em São Francisco. Dada a flexibilidade, alfabetização e competência da versão mais recente, GPT-4, é fácil acreditar que possui inteligência e personalidade. Até mesmo suas estranhas falhas, conhecidas como “alucinações”, se enquadram nessa teoria.
O GPT-4 e seus concorrentes, como LaMDA e Bard do Google, são treinados em bibliotecas de livros digitalizados e bilhões de páginas da web disponíveis publicamente. A genialidade do modelo de linguagem é que ele aprende sem supervisão, processando palavra por palavra e tentando prever a expressão que falta. Ela faz isso repetidas vezes, bilhões de vezes, sem intervenção externa.
Depois que o modelo ganha conhecimento ao ingerir os registros digitalizados da humanidade, o usuário exibe uma frase desconhecida – uma ou mais. O modelo prevê a primeira palavra mais provável, depois a próxima e assim por diante. Este princípio simples mostrou resultados incríveis em inglês, alemão, chinês, hindi, coreano e outros idiomas, incluindo várias linguagens de programação.
Qual é a diferença entre intelecto e consciência
É significativo que o ensaio seminal sobre inteligência artificial, “Computação e Inteligência”, escrito por Alan Turing, em 1950, evitou a pergunta “As máquinas podem pensar?”, isto é, a questão de saber se elas têm consciência. Turing propôs o "jogo da imitação": um observador pode distinguir objetivamente a saída impressa por um ser humano da saída impressa por uma máquina se as identidades de ambos estiverem ocultas.
Hoje isso é conhecido como teste de Turing, e os chatbots são muito bons nisso, embora neguem habilmente se você perguntar diretamente. A estratégia de Turing deu início a décadas de progresso inexorável que levaram à criação da GPT, mas ignorou o problema.
Implícito no debate sobre chatbots está a suposição de que inteligência artificial é o mesmo que consciência artificial, que ser inteligente é o mesmo que ser consciente. E embora nos humanos e em outros organismos desenvolvidos a inteligência e a consciência estejam conectadas, elas nem sempre se acompanham necessariamente.
Inteligência consiste em pensar e aprender a agir e a partir das ações próprias e dos outros, a fim de prever o futuro com mais precisão e preparar-se melhor para ele. Não importa se isso significa os próximos segundos (“Ah, aquele carro está vindo em minha direção”) ou os próximos anos (“Preciso aprender a programar”). Em última análise, a inteligência tem a ver com ação.
A consciência, por outro lado, está associada a estados de ser - ver o céu azul, ouvir o canto dos pássaros, sentir dor, ser amantes. Não importa nem um pouco se uma inteligência artificial fora de controle sente alguma coisa. Tudo o que importa é que ele tem um propósito não relacionado com o bem-estar da humanidade a longo prazo. E não importa se ele sabe ou não o que está tentando fazer, o que as pessoas chamam de autoconsciência. Ele perseguirá “sem pensar” seu objetivo. Portanto, pelo menos conceitualmente, mesmo que construamos uma AGI, ela não nos dirá muito sobre se sente alguma coisa.
Sabendo de tudo isto, voltemos à questão original de como a tecnologia pode tornar-se consciente. Vamos começar com a primeira de duas teorias.
Que explicação a teoria da informação integrada oferece?
Ela começa articulando cinco propriedades axiomáticas de toda experiência subjetiva concebível. E então pergunta o que um circuito neural precisa para implementar essas cinco propriedades, ativando alguns neurônios e desligando outros. Ou, em outras palavras, o que um chip de computador precisa para ligar alguns transistores e desligar outros.
Interações de causa e efeito dentro de um circuito em um determinado estado ou o fato de dois ativos neurônio pode ligar ou desligar outro neurônio, dependendo das circunstâncias, pode ser implantado em uma estrutura causal multidimensional. É idêntico à qualidade da experiência – como ela é vivenciada, como a forma como o tempo e o espaço são vivenciados ou como as cores são percebidas.
A experiência também tem uma quantidade associada: sua informação integrada. Somente um circuito com um máximo de informações integradas diferentes de zero existe como um todo e tem consciência. Quanto mais informação é integrada, mais o circuito não pode ser reduzido e menos pode ser considerado simplesmente uma superposição de subcircuitos independentes.
A teoria da informação integrada enfatiza a natureza rica da experiência humana. Basta olhar ao redor e o impressionante mundo visível com suas inúmeras diferenças e conexões aparecerá diante de você. Ou veja uma pintura de Pieter Bruegel, o Velho, um artista flamengo do século XVI que retratava temas religiosos e cenas da vida camponesa.
Qualquer sistema que tenha as mesmas conexões internas e poderes causais que o cérebro humano será, em princípio, tão consciente quanto a mente humana. No entanto, tal sistema não pode ser modelado. Deve ser projetado ou construído à imagem do cérebro. Os computadores digitais modernos baseiam-se em acoplamentos extremamente frágeis (a saída de um transistor conectada à entrada de vários transistores) em comparação com o sistema nervoso central (neurônio da coluna cortical recebe dados de entrada e produz dados de saída para dezenas de milhares de outros neurônios).
Assim, os computadores modernos, incluindo os computadores em nuvem, não terão conhecimento de nada, embora com o tempo sejam capazes de fazer tudo o que as pessoas podem fazer. Deste ponto de vista, o ChatGPT nunca será especial. Observe que esta afirmação não tem nada a ver com o número total de componentes, sejam neurônios ou transistores, mas sim com a forma como eles estão conectados. É a interconectividade que determina a complexidade geral do circuito e o número de suas configurações possíveis.
Que explicação a teoria do espaço de trabalho global neural oferece?
Vem da compreensão psicológica de que inteligência como um teatro onde os atores atuam num pequeno palco iluminado, que é a consciência. As ações dos atores são assistidas por uma plateia de processadores que ficam sentados atrás do palco no escuro.
O palco é o espaço de trabalho central da mente, que possui uma pequena capacidade de memória para representar uma única percepção, pensamento ou memória. Vários módulos de processamento – visão, audição, habilidades motoras oculares e de membros, planejamento, julgamento, compreensão da linguagem e fala – competem pelo acesso a este espaço de trabalho central. O vencedor desloca o conteúdo antigo, que fica inconsciente.
De acordo com a teoria do espaço de trabalho global neural, a cena metafórica, juntamente com os módulos de processamento, é mapeada na arquitetura do neocórtex. O espaço de trabalho é uma rede de neurônios corticais na parte frontal do cérebro com projeções de longo alcance para neurônios semelhantes distribuídos por todo o neocórtex nas regiões pré-frontal, parietotemporal e cingulada córtex de associação.
Quando a atividade no córtex sensorial excede um determinado limiar, um evento global é desencadeado nas áreas corticais e, como resultado, a informação é transmitida para todo o espaço de trabalho. A disseminação global da informação torna-a consciente. Dados que não são transmitidos desta forma, como a posição precisa dos olhos ou as regras sintáticas para a construção de frases alfabetizadas, podem influenciar o comportamento, mas não de forma consciente.
Do ponto de vista da teoria neural do espaço de trabalho global, a experiência é muito limitada, semelhante ao pensamento e abstrato - semelhante à escassa descrição que pode ser encontrada num museu sob uma pintura de Bruegel: “Cena em dentro de casa. Camponeses com roupas renascentistas bebem e comem em um casamento."
Ao compreender a consciência do ponto de vista da teoria da informação integrada, o artista transmite de forma brilhante a fenomenologia do mundo circundante numa tela bidimensional. Na compreensão da teoria neural do espaço de trabalho global, esta aparente riqueza é uma ilusão, um fantasma. E tudo o que pode ser dito objetivamente sobre isso está indicado na breve descrição.
A teoria do espaço de trabalho global neural leva plenamente em conta os mitos da nossa era da informática, segundo os quais tudo pode ser reduzido a cálculos. Simulações do cérebro adequadamente programadas, com enorme feedback e algo como um espaço de trabalho central, perceberão o mundo de forma consciente. Talvez não agora, mas em breve.
Qual é a diferença irreconciliável entre as teorias?
Em termos gerais a discussão é a seguinte. De acordo com a teoria do espaço de trabalho global neural e outras teorias do funcionalismo computacional (eles ver a consciência como uma forma de computação), a consciência nada mais é do que um conjunto de algoritmos inteligentes executados em uma máquina Turing. Funções são importantes para a consciência cérebro, e não suas propriedades causais. Se alguma versão avançada da GPT aceitar e produzir os mesmos padrões de entrada e saída que os humanos, todas as nossas propriedades inerentes serão transferidas para a tecnologia. Incluindo nosso precioso tesouro – experiência subjetiva.
Por outro lado, para a teoria da informação integrada, o coração da consciência é o poder causal interno, não a computação. Não é algo etéreo ou intangível. É específico e funcionalmente determinado pela medida em que o passado do sistema determina o seu presente (o poder da causa) e pela medida em que o presente determina o seu futuro (o poder do efeito). E aqui está o problema: a própria relação de causa e efeito, a capacidade de forçar um sistema a realizar uma determinada ação, e não muitas alternativas, não podem ser modeladas. Nem agora, nem no futuro. Isso deve estar embutido no sistema.
Considere um código de computador que modele as equações de campo da teoria geral da relatividade de Einstein, que relaciona a massa à curvatura do espaço-tempo. O software modela com precisão o supermassivo buraco negro, que está localizado no centro da nossa galáxia. Este buraco exerce uma influência gravitacional tão forte sobre o seu entorno que nada, nem mesmo a luz, pode escapar da sua atração.
No entanto, um astrofísico simulando um buraco negro não será sugado para dentro de um laptop pelo campo gravitacional simulado. Esta observação aparentemente absurda realça a diferença entre modelo e realidade: se o modelo for completamente corresponde à realidade, o espaço e o tempo devem ser distorcidos ao redor do laptop, criando um buraco negro que absorve tudo em volta.
É claro que a gravidade não é um cálculo. Possui uma força causal que lhe permite deformar a estrutura do espaço-tempo e atrair tudo o que tem massa. Simular as forças causais de um buraco negro requer um objeto superpesado real, não apenas um código de computador. O poder causal não pode ser modelado, deve ser criado. A diferença entre realidade e modelo reside em seus poderes causais.
É por isso que não chove dentro de um computador simulando uma tempestade. O software é funcionalmente idêntico ao clima, mas não possui o poder causal de liberar vapor e transformá-lo em gotas de água. O poder causal, a capacidade de criar ou aceitar mudanças por conta própria, deve ser incorporado ao sistema. É possível.
Um computador denominado neuromórfico ou biônico poderia ser tão consciente quanto um ser humano. Mas este não é o caso da arquitetura von Neumann padrão, que é a base de todos os PCs modernos. Pequenos protótipos de computadores neuromórficos foram criados em laboratórios, como o chip neuromórfico Loihi 2 de segunda geração da Intel. Mas uma máquina suficientemente sofisticada para produzir algo semelhante à consciência humana, ou pelo menos à consciência de uma mosca da fruta, ainda é um sonho ambicioso para um futuro distante.
Note-se que esta diferença irreconciliável entre teorias funcionalistas e causais não tem nada a ver com inteligência natural ou artificial. Como eu disse antes, inteligência é comportamento. Qualquer coisa que a engenhosidade humana possa produzir, incluindo grandes romances como a Parábola do Semeador, de Octavia Butler e Guerra e Paz, de Leo Tolstoi, podem reproduzir inteligência algorítmica se receberem material suficiente para treinamento. O advento da AGI é uma meta alcançável num futuro não muito distante.
O debate não é sobre inteligência artificial, mas sobre consciência artificial. E este debate não pode ser resolvido através da criação de modelos de linguagem maiores ou de algoritmos de redes neurais mais avançados. Para responder a esta questão, devemos compreender a única subjetividade da qual temos absoluta certeza: a nossa. Assim que tivermos uma explicação clara do ser humano consciência e os seus fundamentos neurais, seremos capazes de alargar a nossa compreensão às tecnologias inteligentes de uma forma consistente e baseada na ciência.
Esta discussão tem pouca influência sobre a forma como os chatbots serão percebidos pela sociedade em geral. Suas habilidades linguísticas, base de conhecimento e charme social logo se tornarão impecáveis. Serão dotados de memória, competência, equilíbrio, raciocínio e inteligência perfeitos. Alguns até afirmam que estas criações da grande tecnologia serão o próximo passo na evolução, o “super-homem” de Nietzsche. Tenho uma visão mais sombria e acredito que essas pessoas confundem o declínio da nossa espécie com o amanhecer.
Para muitas, e talvez a maioria, das pessoas numa sociedade cada vez mais atomizada, desligada da natureza e organizado em torno de redes sociais, será emocionalmente difícil resistir às tecnologias que vivem em telefones. E em diferentes situações, comuns e mais graves, as pessoas se comportarão como se os chatbots tivessem consciência, eles poderiam realmente estar apaixonado, sofrem, esperam e temem, mesmo que não passem de tabelas de consulta complexas. Eles se tornarão indispensáveis para nós, talvez até mais importantes que os seres verdadeiramente inteligentes. Embora os chatbots sintam tanto quanto uma TV ou uma torradeira - nada.
O que mais ler sobre o assunto🤖
- 6 razões pelas quais você não deve confiar cegamente na inteligência artificial
- Por que não devemos ter medo de que as novas tecnologias tomem nossos empregos
- Singularidade tecnológica: é verdade que a tecnologia sairá em breve do nosso controle?
- 8 mitos sobre inteligência artificial nos quais até os programadores acreditam