• sexta-feira , 22 novembro 2024

A influência das emoções e dos processos cognitivos em ambientes de realidade aumentada

The influence of emotions and cognitive processes on the user experience in augmented reality environments

Versão para download
Priscila Maciel Selmo
Centro Universitário Senac
Bacharelado em Comunicação Visual
priscila.selmo@gmail.com
Resumo. A Realidade Aumentada é uma tecnologia que traz um novo modelo de interação, quando comparado ao que estamos habituados em computadores ou mobiles. Isto implica em novos desafios para uma interface gráfica que deve ser intuitiva e facilitar a interação. Para isso, é necessário que haja entendimento de como essa interação ocorre para o usuário. Dessa forma, este trabalho procura entender como funcionam os processos cognitivos e as emoções para, assim, refletir e analisar a influência que exercem na experiência do usuário em ambientes de Realidade Aumentada.
Palavras-chave: Realidade Aumentada, Cognição, Interfaces Digitais, Experiência do Usuário (UX).
Abstract. Augmented Reality presents a new design model for technological interaction in comparison to systems currently being used with computers and mobile devices.  It will lead to new challenges for designing the graphical user interface (GUI), which must always be intuitive and make the user’s interaction easier. To do this, it is necessary to understand how this interaction occurs for the user.  Thus, this work is an attempt to understand how cognitive processes and emotions operate, in order to eventually reflect about and analyze their influence on the user experience in Augmented Reality environments.
Key words: Augmented Reality, Cognition, Digital Interface, User Experience (UX).
1. Introdução
Após a criação e difusão dos computadores pessoais e da internet, a mentalidade de toda uma geração foi alterada. Pela primeira vez, a máquina deixa de ser vista ou pensada como um objeto extracorpóreo, uma extensão da técnica manual. Os computadores pessoais ofereciam algo a mais: a possibilidade de pensar e interagir com um ambiente completamente novo – o espaço virtual. “Há poucos atos criativos na vida contemporânea mais significativos que esse, e poucos com consequências sociais tão amplas”, diz Johnson (2001, p. 26) sobre a interface do usuário.
A primeira Interface Gráfica do Usuário (GUI, do inglês Graphical User Interface) permitiu que a interação do sujeito com o sistema computacional deixasse de ser privilégio de programadores, uma vez que tudo era manipulado através de linhas de comando, no momento em que passa a trabalhar com elementos gráficos. E assim o computador se configura como um sistema simbólico:
Aqueles pulsos de eletricidade são símbolos que representam zeros e uns, que por sua vez representam simples conjuntos de instrução matemática, que por sua vez representam palavras ou imagens, planilhas e mensagens de e-mail. O enorme poder do computador digital contemporâneo depende dessa capacidade de auto-representação (JOHNSON, 2001, p. 20).
Com isso, emergem novos desafios: cognitivos, à medida que esse novo espaço digital permite mobilidade e interação; e simbólicos, considerando que era necessário recriar um universo estritamente digital a partir de metáforas. E, se esses eram os primeiros desafios da criação de um novo espaço, o fortalecimento e popularização das interfaces indicam que seu sucesso se deve ao entendimento de que, além de informações em bits exibidos em tela, o que estava sendo criado era uma nova forma de linguagem.
Com a evolução e a popularização da navegação pelo espaço virtual, surgem novas formas de interação do homem com sistemas computacionais. Um desses casos é a Realidade Aumentada (RA), uma tecnologia que permite a inserção de objetos virtuais no campo de visão do mundo real. Apesar de ser uma vertente da Realidade Virtual, essa difere por não imergir completamente o usuário em ambiente virtual, mas suplementa a realidade. Ainda, os objetos virtuais sobrepostos à visão são tridimensionais e permitem interatividade (AZUMA, 1997, p. 2).
Consideramos que, com a RA, estamos, mais uma vez, diante de uma nova linguagem que nos traz problemas de ordem muito semelhante aos enfrentados na criação da primeira interface, em 1970. Com a Realidade Aumentada, somos obrigados a pensar a comunicação em elementos tridimensionais que dividem espaço com o campo de visão do mundo real. A partir daí surgem diversos questionamentos: como as informações devem ser desenhadas? A qual distância do usuário e com quais dimensões? Como elas devem surgir no campo de visão para não gerar experiências negativas? Enfim, como tornar agradável a experiência na Realidade Aumentada?
Este trabalho pretende apresentar alguns processos mentais que influem direta ou indiretamente na interação do usuário com o sistema de Realidade Aumentada. Partindo do pressuposto de que o designer deve se apropriar do conhecimento sobre os processos envolvidos na interação virtual para, assim, projetar. Este trabalho levanta estudos sobre cognição e emoções, e os elege como fio condutor da discussão sobre o projeto em Realidade Aumentada. Procura-se analisar e refletir sobre a influência desses processos cognitivos e das respostas emocionais com que lidamos no ambiente virtual da RA.
A escolha da Realidade Aumentada como tema central se deu, principalmente, por se tratar de uma tecnologia que utiliza a imagem para a interação de uma forma diferente da que já estamos habituados: a informação tridimensional. Já o interesse pelo Cognitivismo e emoções veio a partir de questionamentos sobre as informações: “como elas devem ser desenhadas? A qual distância do usuário, com quais dimensões? Como devem surgir no campo de visão para não gerar experiências negativas?”.
O procedimento metodológico deste trabalho baseia-se inteiramente em levantamentos bibliográficos e iniciou-se em setembro de 2012.
Na primeira parte do trabalho, são apresentados os princípios da Realidade Aumentada – com base na Realidade Virtual, a fundamentação teórica do conceito de Realidade Mixada, as formas de interação e exibição nos sistemas. Além disso, o capítulo Espaço e Mobilidade dedica-se a pensar sobre a relação do usuário com tecnologias vestíveis, que permitem mobilidade pelo espaço enquanto o sistema funciona e transformam o corpo no suporte de seu acontecimento. Para esta primeira parte, a conceituação apoia-se, principalmente, na obra dos brasileiros Claudio Kirner e Romero Tori, bem como nos estudos de um dos primeiros pesquisadores da Realidade Aumentada, Ronald Azuma. A discussão sobre computação vestível foi baseada nas pesquisas de Steve Mann e Paula Sibilia; também foi referenciada a obra de André Lemos para refletir sobre a ideia de espaço e mobilidade.
Já com o entendimento do objeto de estudo, o segundo capítulo trata dos processos cognitivo, memória, percepção e atenção, bem como influências e reações emocionais. Para conceituar o processo mental, foi considerada principalmente a teoria de António Damásio, que acaba influenciando a discussão ao longo do capítulo. Para fundamentar os processos de respostas emocionais e o processo cognitivo da atenção, referencia-se o autor Donald Norman. Para complementar a conceituação de processos cognitivos, também são referenciados Rogers Preece, Jerome Bruner e Robert Sternberg.
A terceira parte é dedicada à analise de exemplos reais e atualmente vigentes de Realidade Aumentada, com base nas discussões apresentadas ao longo do trabalho.
2. Realidade Aumentada
A Realidade Aumentada (RA) é uma tecnologia que adiciona imagens virtuais ao meio físico, aumentando ou enriquecendo a realidade. Com a ajuda de dispositivos específicos – tais como óculos, capacetes, displays de mão, entre outros -, objetos virtuais são sobrepostos à visão do usuário em tempo real, criando um ambiente híbrido entre os mundos real e virtual.
Os objetos virtuais, por sua vez, são as entidades tridimensionais que enriquecem o ambiente real. Por exemplo: uma sala vazia (real) poderia ser mobiliada virtualmente com a inserção de objetos modelados em 3D, posicionados adequadamente pelo computador.
Dessa forma, a realidade aumentada se constitui como um espaço-informação virtual tridimensional que comporta, por conta de sua natureza, novas formas de metáforas visuais e interações em sua interface. Com mais uma dimensão, as informações adquirem outro aspecto, a movimentação por esse espaço deixa de ser limitada por displays e os aparatos procuram cada vez mais integrar-se ao corpo do usuário.
Realidade Virtual
O desenvolvimento da Realidade Aumentada, no entanto, se deve ao advento da Realidade Virtual (RV), também um ambiente virtual tridimensional que é, porém, imersivo.
Por ser um termo abrangente, existem várias definições que variam de acordo  com as experiências e área de conhecimento do pesquisador (NETTO, MACHADO, OLIVEIRA, 2002, p. 06).  Neste trabalho, a definição adotada é de que a RV:
“É uma interface avançada para aplicações computacionais, que permite ao usuário a movimentação (navegação) e interação em tempo real, em um ambiente tridimensional, podendo fazer uso de dispositivos multisensoriais, para atuação ou feedback.” (TORI, KIRNER, 2006, p. 07).
Na prática, o usuário utiliza dispositivos (ver Figura 1) para poder observar e navegar por um ambiente digital 3D atualizado em tempo real e com seis graus de liberdade (6DOF). Esses seis graus dizem respeito às seis possibilidades de movimento num espaço tridimensional, que são: para frente e para trás, acima e abaixo, para a direita e para a esquerda, inclinação para cima e para baixo, angulação à esquerda e à direita, e rotação à esquerda e à direita. (NETTO, MACHADO, OLIVEIRA, 2002, p. 06)

Figura 1: Realidade Virtual – dispositivos sensoriais. Fonte: Jonathan Strickland, Disponível em: http://electronics.howstuffworks.com/gadgets/other-gadgets/virtual-reality7.htm. Acesso em 20 mar. 2013.
A imersão, que é entendida aqui como o senso de pertencimento do usuário ao cenário virtual, define dois tipos de sistemas:
“A realidade virtual é imersiva quando o usuário é transportado predominantemente para o domínio da aplicação, através de dispositivos multisensoriais, que capturam seus movimentos e comportamento e reagem a eles (capacete, caverna e seus dispositivos, por exemplo), provocando uma sensação de presença dentro do mundo virtual. A realidade virtual é categorizada como não-imersiva quando o usuário é transportado parcialmente ao mundo virtual, através de uma janela (monitor ou projeção, por exemplo), mas continua a sentir-se predominantemente no mundo real.” (TORI, KIRNER, 2006, p. 08)
Essas categorias são definidas por níveis de imersão possíveis, mas convém destacar que, mesmo que uma realidade virtual seja considerada não-imersiva, ela ainda proporciona algum grau de imersão e divide o lugar com o mundo real. Se a visualização do ambiente virtual acontece no monitor, por exemplo, ao desviar o olhar o usuário sai do mundo virtual para o real.
Para a imersão, pode-se usar um capacete, no qual um sensor de movimento informa ao computador a imagem que deve ser projetada de acordo com a posição da cabeça, ou entrar em uma espécie de caverna (ver Figura 2), em que o usuário é colocado dentro de um cubo com projeções nas paredes, piso e teto, geralmente utilizando outros acessórios (como óculos estereoscópicos). Em alguns casos, essa experiência pode ser melhorada com outros tipos de dispositivos que estimulam outros sentidos, como experiências sonoras e táteis (Ibid., p. 08).

Figura 2: CAVE – projeções e acessórios. Fonte: Los Alamos National Laboratory – Foto por LeRoy Sanchez, 2006. Disponível em: http://www.flickr.com/photos/losalamosnatlab/5021564660/in/photostream.
Acesso em 22 mar. 2013.
Ainda, outro fator que contribui para o sentimento de pertencimento ao mundo virtual é o próprio aspecto do ambiente e seus elementos. Cores, texturas, iluminação e precisão geométrica são atributos necessários para que a representação ganhe consistência e colabore para a visualização e imersão.
Quanto à interação com o mundo virtual, existem três formas distintas que o sistema pode assumir: uma sessão de RV exploratória acontece quando o indivíduo se movimenta pelo espaço, exigindo da computação apenas detectar a posição do usuário e alterar o ponto de vista dentro da aplicação; a experiência em um sistema passivo também leva o usuário à movimentação pelo mundo digital, mas sem que ele tenha controle algum da exploração do ambiente; já uma sessão de RV interativa permite que a exploração seja controlada pelo usuário e “além disso, as entidades virtuais do ambiente respondem e reagem às ações do participante” (NETTO, MACHADO, OLIVEIRA. 2002, p.16). Para que o usuário possa interagir, no entanto, dispositivos de interação, como luvas ou controles 3D, são indispensáveis.
É importante notar aqui que o foco, ou interesse maior, da Realidade Virtual é explorar a interatividade[1] que esta plataforma permite. Em muitos casos, a interface se baseia em simulações de objetos reais, aproveitando-se de um conhecimento cognitivo já desenvolvido pelo usuário: o aprendizado do mundo real.
Por outro lado, a RV traz consigo a possibilidade do imaginário – é possível criar um mundo virtual abstrato, um universo imaginário que não está preso apenas à palavras ou imagens, mas que é experienciado pelos sentidos. Essa é uma tendência herdada dos jogos, que fazem do usuário um protagonista de histórias em mundos completamente fictícios (TORI, KIRNER. 2006). Nesse caso a interface procura formas intuitivas de interação – isto é, considera como a interação e movimentação se dão no mundo real -, ou dá algum tipo de suporte para o aprendizado do mundo virtual.
A primeira aplicação da Realidade Virtual, e uma das mais difundidas, são as simulações (NETTO, MACHADO, OLIVEIRA. 2002). Simuladores de voo, de montagens, de processos produtivos, entre outros, são exemplos de aplicações industriais.
Existem possibilidades de aplicações em diversas outras áreas:
  • Medicina e Saúde, com simulações cirúrgicas, tomografias tridimensionais, terapias cognitivas, ensino de anatomia, entre outros;

Figura 3: Simulação de cirurgia. Fonte: Revista Informática Médica,1999. Disponível em: http://www.informaticamedica.org.br/informaticamedica/n0202/index.html.
Acesso em 22 mar. 2013.
  • Arquitetura e Urbanismo, para planejamentos de obras e decoração, projetos de artefatos, etc;
  • Ciências, possibilitando a apresentação visual de conceitos abstratos, como reações químicas, estruturas atômicas ou a visualização de superfícies planetárias e galáxias. É uma área com muitas possibilidades de aplicação da RV;
  • Educação, que pode utilizar sistemas de realidade virtual no ensino convencional e à distancia, com laboratórios virtuais, aulas com atividades colaborativas etc;
  • Entretenimento, com turismos e passeios virtuais, cinemas, esportes e os games, que podem aproveitar-se da criação de ambientes possíveis e impossíveis, além de permitir jogos em tempo real e em rede.

Figura 4: Jogo em realidade virtual. Fonte: Fábio Pazzini, 2009. Disponível em: http://www.flickr.com/photos fabiopazzini/3210987752/in/photostream/.
Acesso em 22 mar. 2013.
Realidade Misturada
Os objetos virtuais, porém, não são encontrados apenas no sistema de imersão, podendo misturar-se a objetos reais e caracterizar o que se chama de Realidade Mixada, ou Realidade Misturada (RM) – contexto em que se insere a Realidade Aumentada.  Para Tori e Kirner (2006, p. 23), no entanto, “esses termos são usados de maneira indiscriminada, predominando o uso da realidade aumentada”.
A realidade misturada acontece quando há sobreposição de elementos virtuais a uma cena real, mostrada ao usuário em tempo real com o auxílio de algum dispositivo tecnológico (TORI, KIRNER, 2006, p. 23). Diferente da Realidade Virtual, então, a RM incorpora elementos virtuais ao cenário real ou considera elementos reais no ambiente virtual, estabelecendo sempre uma relação de complementação entre os mundos virtual e real.
Essa complementação pode acontecer com diferentes níveis de mistura. Milgram e Kishino introduziram o conceito de conjunto “continuum virtual”:

Figura 5: Realidade Misturada – Diagrama de Milgram.
Fonte: Milgram e Kishino, 1994. In: BRAGA, 2012.
“The concept of a “virtuality continuum” relates to the mixture of classes of objects presented in any particular display situation (…), where real environments, are shown at one end of the continuum, and virtual environments, at the opposite extremum. The former case, at the left,  defines environments consisting solely of real objects (…), and includes for example what is observed via a conventional video display of a real-world scene. An additional example includes direct viewing of the same real scene (…). The latter case, at the right, defines environments consisting solely of virtual objects (…), an example of which would be a conventional computer graphic simulation. (…) the most straightforward way to view a Mixed Reality environment, therefore, is one in which real world and virtual world objects are presented together within a single display, that is, anywhere between the extrema of the virtuality continuum.” (MILGRAM; KISHINO, 1994, p.3)[2]
Para Kirner e Kirner (2011, p.21), porém, a definição de Milgram considera apenas a forma de exibição nos displays[3] e o tipo de interação é quem define se o ambiente é de RA ou VA:
“Se o usuário interagir com os objetos virtuais da mesma maneira que interage com os objetos reais, ele estará em um ambiente de realidade aumentada. Por outro lado, se o usuário interagir com objetos reais e virtuais, usando os dispositivos de realidade virtual, ele estará em um ambiente de virtualidade aumentada.”
Sendo assim, a transição de um extremo para o outro não seria contínua, como propôs Milgram, mas abrupta, conforme Figura 9, por considerar a troca na forma de interação, independentemente da quantidade de objetos virtuais ou reais:

Figura 6: Diagrama de Milgram adaptado para considerar as interações do usuário.
Fonte: Kirner; Kirner, 1994.
Temos até aqui, então, visões que nos permitem entender a Realidade Aumentada como uma tecnologia imersa num contexto complexo e que é vista ou considerada a partir de diferentes parâmetros: a interface, as formas de interação, ou outros exemplos como tipos de sistema e inteligência.
A Realidade Aumentada ocorre quando objetos virtuais são inseridos no campo de visão de um ambiente real. Assim, a “interface do usuário é aquela que ele usa no ambiente real, adaptada para visualizar e manipular os objetos virtuais colocados em seu espaço” (TORI; KIRNER, 2006, p. 24). Na RA, então, a realidade é “aumentada”, ou enriquecida, por objetos virtuais.
Para Azuma (1997, p. 2), a Realidade Aumentada:
“allows the user to see the real world, with virtual objects superimposed upon or composited with the real world. Therefore, AR supplements reality, rather than completely replacing it.” [4]
Seguindo três características básicas (AZUMA, 2001):
“- Combines real and virtual objects in a real environment;
– Runs interactively, and in real time; and
– registers (aligns) real and virtual objects with each other.”[5]
Bem como na RV, os objetos virtuais também permitem interação do usuário em tempo real e a partir de aparatos sensoriais (BRAGA, 2012).
A RA também procura utilizar dispositivos que sejam o menos perceptíveis possível, numa tentativa de conceder naturalidade às ações dentro do sistema. Assim, por mais que os visualizadores sejam gadgets indispensáveis, a interação tende a se apoiar em agentes virtuais. Estes permitem que o usuário controle o sistema, por exemplo, através de comandos de voz ou gestos.
Outra tendência é que Realidade Aumentada é a utilização de interfaces tangíveis, cuja interação se dá com o mundo real, isto é, objetos e instrumentos físicos, quando manipulados, promovem a interação com o mundo virtual (AZUMA, 2001).

Figura 7: Manipulação de objetos reais para interação na RA. Fonte: Slashgear.
Disponível em: http://www.slashgear.com/canon-mreal-mixed-reality-hands-on-21270443/.
Acesso em 23 mar. 2013.
Assim, é possível que o usuário navegue, selecione, manipule e controle o sistema de realidade aumentada. Mas, frente a diversas formas de interação disponíveis, qual delas mais se aproxima de uma uma experiência agradável ao usuário? Qual o primeiro passo para que essa interface desperte interesse, se torne intuitiva ou estabeleça uma comunicação clara com ele?
Nesse ponto, a visualização eficaz do sistema também é fator integrante e essencial, uma vez que a visão é o sentido fundamental para a RA. Por mais que existam sistemas que utilizam comando de voz ou algum tipo de controle físico para a interação, a visão ainda se destaca como o principal sentido pelo qual sentimos e percebemos o mundo.
A visão humana é binocular, ou seja, as imagens formadas no cérebro são geradas pelas informações enviadas por dois olhos em conjunto. Isso permite que informações de profundidade e distância sejam melhor avaliadas, conferindo mais precisão na percepção. Com isso, temos que:
“A visão tridimensional que se tem do mundo é resultado da interpretação, pelo cérebro, das duas imagens bidimensionais que cada olho capta a partir de seu ponto de vista e das informações sobre o grau de convergência e divergência.” (SISCOUTO, et. al., 2006, p. 221)
Várias técnicas se baseiam nessa premissa para atingir o efeito de 3D: estereoscópios, técnicas de polarização da luz, óculos obturadores sincronizados, ou mesmo os simples anáglifos, que utilizam duas cores diferentes e um óculos que as filtra para formar duas imagens. (ibid., 2006)

Figura 8a: Capacete HMD (head-mounted display) com visão estereoscópica.
Fonte: Jvrb.org. Disponível em: http://www.jvrb.org/past-issues/1.2004/34.
Acesso em 23 mar. 2013

Figura 8b: Óculos HDM com visão monocular.
Fonte: Techwatcher-asia. Disponível em: http://techwatcher-asia.com/?attachment_id=143.
Acesso em 23 mar. 2013
A estereoscopia da visão humana[6] é, então, um dos itens que tanto a RV quanto a RM levam em consideração. Este é um dos principais papeis dos óculos para visualização direta do sistema: enviar imagens separadas a cada olho para que o cérebro possa interpretá-las corretamente, ou enviar a informação para apenas um olho. Caso contrário, as imagens seriam percebidas como bidimensionais, descaracterizando os sistemas.
No entanto, um display binocular, com a mesma imagem para os dois olhos, tende a causar mais desconforto (olhos cansados e fadiga) que os dispositivos monoculares (VAISE e ROLLAND In: AZUMA, 2001).
Questões como essa devem ser consideradas no momento de projetar um sistema de Realidade Aumentada. Pouco adiantaria, por exemplo, se a interface de um sistema fosse intuitiva, mas funcionasse em um dispositivo que causa desconforto nos olhos do usuário.
Um projeto deve se preocupar em conhecer seu usuário final, considerando suas limitações físicas, biológicas e cognitivas. Sendo assim, quais são os processos internos com os quais nos deparamos ao interagir com a Realidade Aumentada? Quais deles devem ser considerados para que o usuário sinta-se confortável nesta interação? E até qual ponto esse tecnologia pode tornar-se invasiva?
A idealização de espaços híbridos como suporte para interação e comunicação sai do imaginário coletivo e da ficção científica para ser encarado como uma tecnologia em potencial; mas se, de fato, estamos diante de uma nova linguagem, deve haver responsabilidade ao se criar esse espaço, com sistemas que considerem a saúde e bem-estar dos usuários (pois falamos aqui de questões relacionadas a processos mentais e neurológicos), bem como todas as questões éticas envolvidas em uma tecnologia que beira a ubiquidade.
Espaço e Mobilidade
Dispositivos tecnológicos como telefones celulares, aparelhos de GPS, tablets, entre outros, são aparelhos que proporcionam a troca de informação independentemente da localização – diferente de como se dava a relação com telefones fixos. A comunicação ganhou um aspecto de mobilidade e cada vez mais o homem da metrópole é atravessado por dados transmitidos via wi-fi, Bluetooth, ondas de telefonia móvel etc.
A Realidade Aumentada, por sua vez, se utiliza de dispositivos que podem ser levados a ambientes internos e externos, possibilitando que o usuário tenha mobilidade pelo espaço enquanto está conectado ou interagindo com o sistema.
Este fato implica em alterações em dois tipos de relação: (1) entre indivíduo e o espaço que ocupa e; (2) do sujeito com seu corpo, transformado em suporte para aparatos tecnológicos. Ambas questões são extensas e implicam em reflexões que esbarram em diversos campos do conhecimento – como a Filosofia, Sociologia e Antropologia, além de todas as questões éticas envolvidas. A intenção desse capítulo, portanto, não é aprofundar-se nesses temas, mas discutí-los, a fim de demonstrar alguns impactos provocados pela RA que também são diretamente afetados pelos processos cognitivos e emocionais (ver capítulo 3).
Antes das possibilidades da Realidade Aumentada, qualquer espaço ocupado pelo usuário, ambientes internos ou externos, só era passível de ser modificado por ações e objetos reais – o que, consequentemente, resulta em alterações físicas. Já com os dispositivos de RA, essa percepção da atualização do espaço real pode acontecer por interferência de objetos virtuais projetados.
Steve Mann, pesquisador e inventor de um dispositivo chamado EyeTap, um óculos monocular que, entre outras funções, sobrepõe imagens simplificadas sobre o mundo real. Com esse projeto, Mann introduz o conceito de Diminished Reality – em tradução literal, “Realidade Diminuída”). Por exemplo, anúncios publicitários na rua poderiam ser substituídos por imagens simplificada, como uma mensagem escrita em preto sobre um quadrado branco (virtual).

Figura 9: EyeTap, projeto de Steve Mann. Fonte: Wearcam.org. Disponível em: http://wearcam.org/industrial_design/. Acesso em 01 abr. 2013

Figura 10: Diminished Reality – à direita, o anúncio foi sobreposto por informações visuais reduzidas. Fonte: Reprodução do vídeo “Diminished Reality concept video by Steve Mann and James Fung from 2008”.Disponível em: http://www.interaction-design.org/tv/Diminished_reality_steve_mann_2008.html.
Acesso em 01 abr. 2013
O que um dispositivo como o EyeTap faz é estabelecer uma relação direta entre ele mesmo e os lugares por onde pode transitar. Esta relação, por sua vez, permite que informações digitais sejam atribuídas à localidades específicas, dando origem ao conceito de mídias locativas, que são:
“Como um conjunto de tecnologias e processos info-comunicacionais cujo conteúdo informacional vincula-se a um lugar específico. (…) Dessa forma, os lugares/objetos passam a dialogar com dispositivos informacionais, enviando, coletando e processando dados a partir de uma relação estreita entre informação digital, localização e artefatos digitais móveis.” (LEMOS, 2007, p. 1)
Com esse mapeamento informacional, pode-se, por exemplo, localizar serviços específicos em uma região, ter dados sobre lugares mais frequentados, rastrear o fluxo de pessoas, entre outros.
Esses dispositivos computacionais que permitem que o sujeito tenha mobilidade pelo espaço geralmente podem ser usados sob, sobre ou na roupa – como acessórios ou integrados à malha -, e são chamados de “computadores vestíveis” (wearable computing). Óculos de Realidade Aumentada como o EyeTap, por exemplo, são considerados tecnologias vestíveis.
O que temos aqui, então, é uma tecnologia que utiliza e se apropria do corpo como referencial de lugar. As tecnologias vestíveis posiciona m ou contextualizam a computação de tal modo que o ser humano e computador se tornam intimamente interligados (MANN, 2013). A partir desse momento, toda uma noção que fora construída de “dentro e fora” é abalada, as fronteiras entre o corpo e a máquina deixam de ser nítidas. Com isso, podemos questionar: como o cérebro mantém a consciência do corpo? Os processos cognitivos reagem a estímulos virtuais cada vez mais integrados ao corpo real? Como fica a noção do “eu” nesse ambiente?
Além disso, os dispositivos wearable fazem com que as pessoas estejam “accesibles las 24 horas del día, cualquiera que sea su localización en la extensa geografía del mundo físico”[7] (SIBILIA, 2005 p. 65). Além de “virtualizar o corpo”, a presença constante da tecnologia também amplia as possibilidades de rastreamento de localização usuário, de boa parte de suas ações (tanto no mundo real quanto no virtual) e dos ambientes por onde circula.
Este conceito de monitoramento invisível digital, também conhecido por surveillance, ameaça não só os preceitos de privacidade, individualidade e liberdade, mas faz com que a sociedade se veja obrigada a repensar a ordem até então estabelecida. Para Paula Sibilia (2005, pg. 68):
“Tanto la definición como el uso de los espacios sufren alteraciones en función de ese procesamiento digital, que diluye la clásica oposición entre las esferas pública y privada. Las subjetividades y los cuerpos contemporáneos se ven afectados por las tecnologías de la virtualidade (….), y por los nuevos modos que inauguran de entender y vivenciar los limites espacio-temporales que estas tecnologias inauguran.”[8]
Por fim, a presença constante das tecnologias, a internet e redes sociais ubíquas, provocam uma virtualização do corpo. O sujeito passa a existir na rede por meio de avatares controlados por ele, como se coexistisse consigo mesmo: a noção do eu adquire duas faces.
Em um ambiente de Realidade Aumentada, ainda mais, as noções de um eu-virtual projetado ganham forças e se confundem com o eu-real. Porém, como veremos no próximo capítulo[9], o corpo é um alicerce para a construção da consciência. Então as noções do eu podem confundir-se, mas não se mesclam. Há representações diferentes e simultâneas do eu no cérebro: uma para o corpo físico, outro para o corpo virtualizado. O cérebro percebe a existência do corpo e de sua posição no espaço enquanto os sentidos são transportados para o mundo virtual.
3. Emoção e Cognição
O termo cognição se refere a processos ou atividades pelo qual se adquire conhecimento. Falar de cognição, então, significa pensar de modo analítico sobre o funcionamento da mente. Para Preece (2005, p. 84):
“A cognição é o que acontece em nossas mentes quando realizamos nossas atividades diárias; envolve processos cognitivos, tais como pensar, lembrar, aprender, fantasiar, tomar decisões, ver, ler, escrever e falar (…). A cognição também foi descrita no que diz respeito a tipos específicos de processos tais como:
– atenção;
– percepção e reconhecimento;
– memória;
– aprendizado;
– leitura, fala e audição;
– resolução de problemas, planejamento, raciocínio e tomada de decisões.”
A Psicologia Cognitiva, ou Cognitivismo, é a ciência que se debruça sobre a compreensão do comportamento humano através das inúmeras facetas de seus processos mentais. Preocupa-se com a forma “como as pessoas percebem, aprendem, recordam e pensam sobre a informação” (ibid., p. 22), isto é, suas pesquisas estão voltadas aos processos de perceber, registrar, recordar, utilizar e comunicar.
Vale ainda destacar que a Psicologia Cognitiva é uma área que se interliga a diversos outros campos de estudo pelo fato de que processos cognitivos não se manifestam, ou se sustentam, de forma autônoma. Isto é, ocorre interação entre processos cognitivos (por exemplo, um pensamento que depende da memória que, por sua vez depende da percepção) e com outros processos não-cognitivos, como os biológicos. (ibid., p. 26)
Mas, para este trabalho, há outro agente influenciador que se mostra mais relevante: as emoções. António Damásio, neurocientista, constatou que indivíduos que possuem a área do cérebro responsável pelas emoções danificada apresentam dificuldades no aprendizado:
“Se as emoções provém uma resposta imediata para certos desafios e oportunidades enfrentados por um organismo, o sentimento relacionado a elas provê isso com um alerta mental. Sentimentos amplificam o impacto de uma dada situação, aperfeiçoam o aprendizado e aumentam a probabilidade que situações similares possam ser antecipadas.” (DAMÁSIO, 2001, p. 781)
O autor ainda faz uma distinção importante entre emoção e sentimento. A primeira precede os sentimentos e é um mecanismo de regulação da vida que contribui para o sucesso da evolução, juntamente com outros processos como a regulação metabólica, a homeostase, entre outros.
“As emoções são programas de ação complexos e em grande medida automatizados, engendrados pela evolução. As ações são complementadas por um programa cognitivo que inclui certas ideias e modos de cognição, mas o mundo das emoções é sobretudo feito de ações executadas no nosso corpo, desde expressões faciais e posturas até mudanças nas vísceras e meio interno.” (DAMÁSIO, 2011, p. 142)
A emoção, então, sempre desencadeia alterações no corpo e é, em si, um conjunto complexo de reações químicas e neurais. Com isso, o neurocientista considera a emoção um fenômeno biológico. Já os sentimentos são “percepções compostas daquilo que ocorre em nosso corpo e na nossa mente quando uma emoção está em curso” (ibid., p. 142).
Norman (2008) cientista e psicólogo cognitivo, também busca entender a força exercida pelas emoções, porém sobre a relação do homem com objetos. Seus estudos sugerem que o processamento emocional se dá a partir de três níveis estruturais do cérebro, que seriam responsáveis pela interpretação emocional da interação com objetos.[10]
Tanto em Damásio (2003) quanto em Norman (2008), o entendimento de que as emoções influenciam processos como a atenção, reconhecimento e memória, faz com que a preocupação com os aspectos cognitivos para uma plataforma de Realidade Aumentada envolva também, e em primeiro lugar, os processos emocionais gerados pela interação com a interface.
Entretanto, para entender como as emoções atuam no cérebro, no corpo e nos processos cognitivos, é preciso compreender qual a sua função junto à mente, consciência e self, pois esses processos se relacionam e exercem influência um sobre o outro.
Mente, Consciência e Self
Para entender o funcionamento das emoções e a forma como se relacionam à mente, aos processos cognitivos e ao corpo, será feito um recorte da obra de António Damásio. O neurocientista desenvolve toda sua obra à luz de conceitos biológicos e evolucionistas, fazendo uma distinção importante entre cérebro, mente, consciência, self e protosself. Defende que a mente e corpo exercem influência direta um sobre o outro, e que a consciência surge quando a mente encontra o self.
Com isso, além de justificar a importância que o cérebro traz para o sucesso da evolução, o autor traz uma nova perspectiva dentro das linhas de pesquisa em neurociência, que é considerar a emoção e a subjetividade como consequências da evolução. Sendo assim, é importante ressaltar que o grande impulsionador da evolução é a gestão da vida.
Administrar e preservar eficientemente a vida já são funções desempenhadas por células quaisquer, até mesmo pelos organismos mais simples (unicelulares) e, portanto, não são novidades na evolução biológica. Porém, à medida que os organismos se tornaram mais complexos, este mecanismo ganhou estruturas especificadas.
O sistema nervoso nasce para contribuir à gestão da vida nesta nova situação. Células transmissoras de informações garantem que as demais células, que em grupos configuram tecidos e, depois, órgãos e sistemas, possam desenvolver suas funções individual e conjuntamente.
Em um sistema ainda mais evoluído, surge um tipo de célula extremamente especializada em administrar os processos vitais: o neurônio. Sua função é beneficiar todas as células do corpo, assistindo o corpo multicelular como um todo na gestão da vida. (DAMÁSIO, 2001, p.56). O cérebro, então, é um órgão que dedica sua existência favor do funcionamento do organismo e da manutenção da vida. Mais além, o cérebro humano cria a mente, e o faz justamente porque uma de suas funções é gerir a vida do organismo.
Porém, ainda que essa gestão seja a função fundamental do cérebro, esta não é sua característica distintiva. O que diferencia o cérebro é sua capacidade de criar mapas e imagens:
“O mapeamento é essencial para uma gestão complexa. Mapear e gerir vida andam de mãos dadas. Quando o cérebro produz mapas, informa a si mesmo. As informações contidas nos mapas podem ser usadas de modo não consciente para guiar com eficácia o comportamento motor, consequência muito conveniente, uma vez que a sobrevivência depende de executar a ação certa” (DAMÁSIO, 2011, p. 87).
Os mapas são padrões distintos criados no cérebro de fora para dentro, através de estímulos, que podem ser externos (vindos do ambiente, como quando se interage com um objeto) ou internos (vindos do corpo, do resgate de memórias ou de simulações neurais[11]).
“O cérebro humano mapeia qualquer objeto que esteja fora dele, qualquer ação que ocorra fora dele e todas as relações que os objetos e as ações assumem no tempo e no espaço, corpo, cérebro e mente”. (ibid., p.88)
E ao criar mapas, o cérebro também cria imagens – “o principal meio circulante da mente” (ibid., p.87) –, que permitem que a consciência experimente os mapas gerados no cérebro como imagens, manipulando e as aplicando sobre o raciocínio.
“Os padrões mapeados constituem o que nós, criaturas conscientes, conhecemos como visões, sons, sensações táteis, cheiros, gostos, dores, prazeres e coisas do gênero – imagens, em suma. As imagens em nossa mente são os mapas momentâneos que o cérebro cria de todas as coisas dentro ou fora do nosso corpo, imagens concretas e abstratas, em curso ou previamente gravadas na memória” (ibid., p.95-96).
As imagens criadas com o mapeamento no cérebro são baseadas nas mudanças do corpo e do cérebro durante a interação do indivíduo com um objeto. No momento da interação, sensores nervosos que estão espalhados pelo corpo geram padrões que a mapeiam. É importante notar que não são imagens unicamente visuais: Damásio chama de imagem qualquer padrão criado pelo processo de mapeamento. Portanto, ao ouvir o som de uma sirene, por exemplo, criamos uma imagem do estímulo sonoro (que foi mapeada em nosso cérebro), da mesma forma que criamos uma imagem da ambulância que a emitia. Uma imagem é sonora, a outra visual. Mas ambas são imagens.
Aliás, as imagens também têm a capacidade de influenciar pensamento e ações – ainda que sejam imagens resgatadas da memória (ver capítulo 3.3). Da mesma forma que, quando evocadas, elas podem ser manipuladas (cortar, ampliar, reordenar etc), gerando o processo que conhecemos como imaginação.
Mapas e imagens, portanto, são resultantes de uma comunicação contínua entre o corpo e o cérebro e podem ser originados a partir de tipos diferentes de estímulos, conforme a tabela:
Variedades de mapas (imagens)
Objetos de origem
I . Mapas da estrutura e estado interno do organismo (mapas interoceptivos)
A condição funcional dos tecidos corporais; por exemplo, o grau de contração da musculatura lisa, parâmetros do estado do meio interno
II. Mapas de outros aspectos do organismo (mapas proprioceptivos)
Imagens de componentes corporais específicos, como articulações, musculatura estriada, algumas vísceras
III. Mapas do mundo externo ao organismo (mapas extereoceptivos)
Qualquer objeto ou fenômeno que ative uma sonda sensitiva, como a retina, a cóclea ou os mecanorreceptores da pele.
Tabela 1: Variedade de mapas (imagens) e os objetos que as originam.
Fonte: DAMÁSIO (2011, p. 103).
Voltamos aqui, portanto, à questão do corpo: como agente mapeador, o cérebro faz do corpo seu tema natural, o introduz como conteúdo do processo mental – afinal, gerir a vida significa gerir o corpo. Essa relação é estreita, cérebro e corpo são ligados um ao outro. Ainda que este seja o objeto mapeado, ele nunca deixa de ter contato com o cérebro. Quanto ao efeito das imagens mapeadas do corpo, estas “têm um modo de influenciar permanentemente o próprio corpo em que se originam” (DAMÁSIO, 2011, p. 119).
Ao mapear o corpo, o cérebro também mapeia suas estruturas especiais de percepção: as mucosas do olfato e paladar, os elementos táteis da pele, os ouvidos e os olhos. Esses mecanismos também compõem o corpo, bem como os órgãos internos, o sistema muscular, as vísceras e todo o meio interno – porém, possuem uma posição privilegiada. A partir deles, da união de um sistema sensorial com a “carne”, o corpo se torna uma barreira que divide o “dentro e fora”. Este mapeamento integrado também gera estruturas que mais tarde dão origem ao self.
O corpo é a fronteira que os sinais vindos do ambiente encontram para chegar ao cérebro. A interação com o mundo causa mudanças no corpo, que por sua vez, são mapeadas no cérebro. Segundo Damásio (2011, p.121):
“A representação do mundo externo ao corpo só pode entrar no cérebro por intermédio do corpo, melhor dizendo, por sua superfície. (…) Sem dúvida é verdade que a mente toma consciência do mundo por intermédio do cérebro, mas é igualmente verdade que o cérebro só pode obter informações por meio do corpo.”
Outra consequência de um mapeamento contínuo e dinâmico é a criação da mente. Ao mapear a si mesmo, o cérebro cria imagens abstratas, que indicam padrões de localização no tempo e espaço, movimento de objetos e sua respectiva localização espacial de acordo com a velocidade, entre outras. E o fluxo contínuo de imagens dessa natureza configuram a mente, uma “combinação sutil e fluída de imagens de fenômenos em curso e de imagens evocadas, em proporções sempre mutáveis” (ibid, p. 96).
Todo dia, ao acordar, experienciamos um contato mais claro com a mente. Entramos no estado de vigília – que é o estado da mente quando estamos acordados – e recuperamos, por vezes gradualmente, o estado de mente consciente.
Mas a mente pode estar consciente ou não. A formação de imagens que se dá pelos mecanismos de percepção ou pela evocação não dependem da consciência. Então, enquanto dormimos e nos encontramos em sono profundo, ou quando o corpo está sob efeito de anestesia, o que ocorre é a continuidade das atividades da mente, que não está em seu estado consciente. Aqui, entende-se consciência como:
“um estado mental no qual existe conhecimento da própria existência e da existência do mundo circundante. Consciência é um estado mental – se não há mente não há consciência; consciência é um estado mental específico, enriquecido por uma sensação do organismo específico no qual a mente atua; o estado mental inclui o conhecimento que situa essa existência: o conhecimento de que existem objetos e eventos ao redor” (DAMÁSIO, 2004, p.197).
Até aqui, então, temos que o corpo e mente estão sempre conectados, através do mapeamento e criação de imagens. Este fluxo intenso de mapeamento e criação ou modificação de imagens no cérebro origina a mente:
“O corpo vivo é o lugar central. A regulação da vida é a necessidade e a motivação. O mapeamento no cérebro é o capacitador, o mecanismo que transforma a regulação simples da vida em uma regulação por intermédio da mente e, por fim, na regulação pela mente consciente.” (ibid., p.139)
Para ser desencadeada a consciência, entretanto, é preciso que ocorra um outro processo: o brotar do self  em uma mente em estado de vigília:
“a essência do self é um enfoque da mente sobre o organismo material que ele habita. Vigília e mente são componentes indispensáveis da consciência, mas o self é o elemento distintivo” (ibid., p. 224).
A presença de um self, uma noção de eu, uma vez que inserido na mente, é o que possibilita uma mente consciente, que relembra e planeja a partir de experiências – não só do legado da evolução, que guiaria comportamentos instintivos-, e que pode organizar estruturas sociais.
Damásio divide o self em três estágios (de evolução ou aparição na mente), que são ligados obedecendo uma ordem hierárquica, mas que são divididos em espaços de trabalho diferentes no cérebro:
“O estágio mais simples tem origem na parte do cérebro que representa o organismo (o protosself) e consiste em uma reunião de imagens que descreve aspectos relativamente estáveis do corpo vivo (…). O segundo estágio [self central] resulta do estabelecimento de uma relação entre organismo (como ele é representado pelo protosself) e qualquer parte do cérebro que represente um objeto a ser conhecido. O terceiro estágio permite que múltiplos objetos, previamente registrados como experiência vivida ou futuro antevisto, interajam com o protosself (…). O resultado é o self autobiográfico” (DAMÁSIO, 2011, pp. 225-226).
O self, portanto, nasce do mapeamento do corpo ao qual a mente se liga. Com a evolução, depois do self central, começa a surgir algum nível de subjetividade e consciência. Mais para frente ainda, o terceiro estágio de self (self autobiográfico) permite a obtenção e acumulação de conhecimentos, bem como seus registros externos, em produtos da cultura.
Se a mente possibilita níveis mais básicos da noção do eu, o self autobiográfico só se torna possível com a consciência, noção de futuro e capacidade de prevê-lo, e da existência de um mecanismo de memória, processo que será discutido mais a frente, no capítulo 3.3.
Emoções em ação
Apesar da importância da emoção neste trabalho, não cabe aqui descrever todo seu processo de nascimento na estrutura do cérebro. Assim, seu processo na evolução será abordado de forma resumida. A discussão aqui gira em torno da influência das emoções em processos cognitivos e na forma como tornou-se elemento fundamental para a gestão da vida.
Norman (2004, p. 30) diz:
“De fato, a emoção torna você inteligente. (…) Sem emoções, sua capacidade de tomar decisões ficaria prejudicada. A emoção está sempre fazendo juízos de valor, apresentando informações imediatas a respeito do mundo: aqui está um perigo em potencial; isto é bom, aquilo é ruim.”
Como já foi citado, emoções são planos de ações complexos, complementados pelo sistema cognitivo, que desencadeiam uma série de reações químicas no corpo. Existem estruturas do cérebro, como a amígdala e regiões especiais do córtex do lobo frontal, que são desencadeadoras de emoções. Assim, emoções acontecem quando imagens processadas no cérebro estimulam essas regiões (DAMÁSIO, 2009). A consequência dessa ação é química:
“Moléculas químicas são secretadas por glândulas endócrinas e por núcleos subcorticais e liberadas no cérebro e no corpo (por exemplo, o cortisol no caso do medo), certas ações são executadas (por exemplo, fugir ou imobilizar-se, contrair o intestino, também em caso de medo), e certas expressões assumidas (por exemplo, uma expressão facial ou postura de terror). É importante, pelo menos nos humanos, o fato de que certas ideias e planos também vêm à mente.” (DAMÁSIO, 2009, p. 142)
Todas essas reações compõe a experiência da emoção e, de fato, nós as sentimos. Temos a sensação de estar bem ou mal, tensos ou relaxados – e esses estados afetam o corpo e cérebro. Por exemplo, “a tristeza desacelera o raciocínio e pode nos levar a ficar ruminando a situação que a desencadeou; a alegria, pode acelerar o raciocínio e reduzir a atenção para eventos não relacionados” (ibid., p.143).
Dessa forma, tratamos aqui de processos que interferem no comportamento. E este, por sua vez, acontece em grande parte em nível subconsciente – ou abaixo da percepção da consciência. Segundo Norman (2004, p.31) “a consciência chega depois, tanto na evolução quanto na maneira como o cérebro processa as informações”. Grande parte do comportamento, isto é, dos julgamentos feitos pelas emoções, foram determinados com a evolução, portanto, antes de alcançar a consciência.
Outro fator importante é que a ação das emoções atinge a cognição, responsável pela interpretação e interpretação lógica do mundo. Esses dois processos influenciam um ao outro. Enquanto algumas emoções são motivadas e impulsionadas pela cognição, os processos cognitivos também sofrem interferência do julgamento das emoções. Norman utiliza o termo afeto para designar este sistema de julgamentos, sejam eles conscientes ou não.
Ainda, o autor elege três níveis de processamento emocional no cérebro – que, consequentemente, refletem sua origem biológica e evolução:
“Para simples animais, a vida é uma série contínua de ameaças e oportunidades, e os animais têm de aprender a responder apropriadamente a cada uma delas. Os circuitos cerebrais básicos, portanto, são na verdade mecanismos de resposta” (NORMAN, 2004, p. 41).
Ele considera que o nível inferior automático, ou visceral, controla reações automáticas. Esta primeira camada corresponde a uma parte da mente que foi biologicamente determinada, e que confere uma série de informações pré-programadas ao comportamento – como o medo de altura, a repulsa por sabores amargos ou o choro de fome do bebê.
“O nível visceral é preconsciente, anterior ao pensamento. É onde a aparência importa e se formam as primeiras impressões. O design visceral diz respeito ao impacto inicial de um produto, à sua aparência, toque e sensação” (ibid., p. 56)
Depois, considera o nível comportamental, que define a maior parte do comportamento do cotidiano, uma vez que está ligado à ações de percepção, ação e reação, como aprender a tocar um instrumento ou dirigir um carro. É o nível que processa a experiência de uso de um produto, que pode estar adequado ou não às suas funções.
“O nível comportamental diz respeito ao uso, é sobre a experiência com um produto (…) A usabilidade descreve a facilidade com que o usuário do produto pode compreender como ele funciona e como fazê-lo funcionar.” (ibid., p. 56)
A terceira e mais alta camada, o nível reflexivo, confere ao ser humano a capacidade de reflexão, tornando possível recordar, refletir e comunicar-se com outros sobre experiências vividas. É o nível que permite a um produto se tornar a representação de conceitos como satisfação pessoal, auto-imagem, evocar lembranças.
“É somente no nível reflexivo que a consciência e os mais altos níveis de sentimento, emoções e cognição residem. É somente nele que o pleno impacto tanto do pensamento quanto da emoção são experimentados (…). Interpretação, compreensão e raciocínio só ocorrem no nível reflexivo.” (ibid., pp. 57-58)
Outra distinção é a questão do tempo. Enquanto os níveis visceral e comportamental se preocupam com o tempo presente, com o “agora”, o nível reflexivo engloba o conhecimento do passado e do futuro. Portanto este se refere a relações de longo prazo, com “sentimentos de satisfação produzidas por ter, exibir, e usar um produto” (ibid., p. 58).
Esses três níveis se relacionam e estão dispostos de forma hierárquica[12]. Assim, o nível comportamental influi sobre o nível visceral, e o nível reflexivo pode aperfeiçoar ou inibir as ações do nível comportamental. Neste processo de interação, “processos de baixo para cima são aqueles impulsionados pela percepção, enquanto os de cima para baixo são impulsionados pelo pensamento” (NORMAN, 2004, p. 45).

Figura 11: Adaptação do diagrama – Três níveis de processamento: Visceral, Comportamental e Reflexivo. Fonte: NORMAN, 2004, p.42.
É importante também notar que todos contemplam algum processo cognitivo – aprendizado, coordenação, atenção, percepção, memória, inteligência etc. Ou seja, o resultado de tudo que fazemos é formado tanto por componentes cognitivos, quanto emocionais (afetivos). E os estados emocionais, além de modificar o corpo, têm a capacidade de modificar o pensamento.
Por fim, a ação das emoções é crucial para a tomada de decisões. Enquanto a cognição interpreta o mundo, nos dando condições de conhecê-lo e compreendê-lo, o afeto (que inclui a emoção), cria juízos de valores (biológicos) que nos permitem a sobrevivência.
Memória
Como antevisto, além do mapeamento constante do corpo permitir a estruturação do self, constituir a mente e ser contribuinte fundamental para a gestão a vida, o cérebro ainda possui um mecanismo de armazenamento das imagens geradas. Esta capacidade de armazenamento, a memória, é o que possibilita a existência do self autobiográfico. Com isso, podemos considerar a memória como um dos mais fundamentais processos cognitivos criados pelo cérebro.
“Além de criar representações mapeadas que resultem em imagens perceptuais, o cérebro (…) cria registros de memória dos mapas sensoriais e reproduz uma aproximação do conteúdo original. Esse processo é conhecido como recall, ou evocação. Lembrar uma pessoa ou evento, ou contar uma história, requer a evocação; reconhecer objetos a nossa volta também, e o mesmo vale para pensar em objetos com os quais interagimos e acontecimentos que percebemos, e para todo o processo imaginativo com o qual planejamos para o futuro” (DAMÁSIO, 2009, p.173).
A memória é constantemente acessada por regiões do córtex responsáveis por associações. Por exemplo, ao ver um carro passando na rua, essas regiões procuram associar a imagem criada pelo estímulo à outra que já tenha sido criada – e para isso, é necessária a busca na região de armazenamento.
Esse primeiro acesso à memória, que armazena boa parte das imagens criadas pelo mapeamento do corpo e de sua interação com o ambiente, pode ser chamado de reconhecimento, processo em que se “seleciona ou identifica um item como um dos que aprendeu anteriormente” (STERNBERG, 2000, p. 155).
Existem muitas teorias sobre o funcionamento da memória e suas várias facetas, ou camadas. O modelo tradicional de memória considera três sistemas: o armazenamento sensorial, o armazenamento de curto prazo e o armazenamento de longo prazo.
O armazenamento sensorial seria o primeiro nível da memória com o qual as informações recebidas pela percepção, as informações do ambiente, têm contato. Caracteriza-se por pouca capacidade de armazenar dados e por um período de tempo sempre breve. (STERNBERG, 2000, p. 158)
O armazenamento de curto prazo recebe as informações sobre os registros sensoriais. Ele não se conecta necessariamente à memória sensorial e retém as informações por mais tempo – geralmente cerca de trinta segundos, mas pode chegar a minutos. As memórias nesse sistema geralmente são armazenadas pela audição (como soam) e visão (como aparentam ser). (ibid., p. 163)
Já o armazenamento de longo prazo possui grande capacidade de estocar informações e pode reter os dados por períodos muito longos. Não se sabe ao certo por quanto tempo duram essas informações na memória de longo prazo, mas é basicamente o nível que permite que se lembre onde estão situados objetos pessoais, conceitos aprendidos na escola, memórias da infância. (ibid., p. 164)
E para que as informações possam ser estocadas, outros três processos estão envolvidos: codificação, armazenamento e recuperação. Estes sim encadeiam-se em relação de hierarquia, constituindo-se como três diferentes estágios.
O primeiro estágio, a codificação, consiste em transformar um dado físico e sensorial em um tipo de representação mental; é o estágio que mais se aproxima dos processos relacionados à percepção. As informações codificadas passam para a segunda operação: o armazenamento, que é basicamente a estocagem dessas informações. Por fim, a recuperação, que refere-se à maneira como esses dados são organizados e como se dá o acesso a cada informação armazenada. (PREECE, 2005; STERNBERG, 2000).
A memória, então, guarda os registros feitos pelo cérebro sobre os aspectos de entidades e eventos que ocorreram para que possam haver evocações futuras. Retém não apenas informações sobre aparência, como agem e soam, mas toda a interação em si é mapeada pelo cérebro. As consequências da interação de um organismo com entidades ou eventos são mantidas na memória. Damásio (2009, p. 169) elenca mais quatro aspectos que são necessários para a o processo da memória:
“Primeiro, os padrões sensitivos-motores associados à visão do objeto (como os movimentos dos olhos e pescoço ou o movimento do corpo inteiro, quando for o caso); segundo, o padrão sensitivo-motor associado a tocar e manipular o objeto (se for o caso); terceiro, o padrão sensitivo-motor resultante da evocação de memórias previamente adquiridas relacionadas ao objeto; quarto, os padrões sensitivo-motores relacionados ao desencadeamento de emoções e sentimentos associados ao objeto.”
Temos aqui, então, que as memórias são preconceituosas, no sentido literal do termo: sofrem influência direta de nossas experiências prévias. É inclusive devido ao fato de que a percepção ocorre sempre sobre a influência de dado contexto, que é mais difícil relembrar de fatos isolados que das circunstâncias em que ocorreram.
Quanto ao processo de armazenamento e reconstituição (evocação) da memória, uma das teorias mais difundidas é a de que esse é organizado com o auxílio de dispositivos mnemônicos. O acesso seria feito através de uma série de agrupamentos – por categorias, por imagens interativas (quando se imagina os objetos que representam palavras das quais precisa lembrar), por palavras relacionadas, por localização (por exemplo, pontos de referência que são lembrados ao se pensar num determinado trajeto), por acrônimos, por acrósticos (quando forma-se uma sentença para ajudar na formação de novas memórias) e, por fim, agrupamentos através de palavras-chave. Essa teoria entende que a memória, então, possui várias estruturas de “lembretes”, configurando a metamemória. (STERNBERG, 2000).
Damásio propõe uma teoria um pouco diferente, que permite entender como as memórias são trazidas (ou acessadas) pela consciência. Não cabe aqui explicá-la na íntegra, por sua complexidade e conceitos específicos da neurociência, mas sim sua ideia central. O autor divide o processo em duas fases, que chamarei aqui de acesso consciente e inconsciente[13].
O acesso consciente depende da ação do inconsciente e é responsável pela recriação das imagens que foram armazenadas. É interessante observar aqui que o cérebro aproveita suas estruturas de percepção para recriá-las, fazendo com que se economize energia e espaço – áreas chamadas de espaço de imagem. É responsável também por tentar sincronizar as imagens da memória (como quando sentimos o cheiro de um perfume o somos capazes de recriar um contexto de forma sinestésica, ou mesmo ao lembrar de alguém falando com a imagem e som sincronizados, como em um filme).
O acesso inconsciente, por sua vez, é a fonte de conhecimento que identifica a evocação e desencadeia a formação das imagens correspondentes ao que foi evocado. É como um banco de dados pelo qual temos acesso com chaves específicas para cada informação arquivada. A chave faz parte do acesso consciente; uma vez que é encaixada, ela faz rodar uma engrenagem específica (desencadeando uma série de processos), que já é parte do acesso inconsciente. Este banco de dados é a fonte das imagens no processo de imaginação, por exemplo. Dessa forma, os conteúdos das memórias estão sempre no nível inconsciente, são implícitos. Passam a ser explícitos somente quando são encaminhados para o espaço de imagem.
Segundo Damásio (2009, p. 183) “Nossa base de conhecimento é implícita, codificada e inconsciente”. Nossas memórias de pessoas, objetos, lugares, eventos, habilidades, relações e mesmo de processos de gestão da vida pertencem a esse espaço inconsciente, aguardando o estímulo consciente para se tornar imagens explícitas ou ações[14].
Este acesso, porém, pode ser facilitado ou dificultado. Para Preece (2005, p. 99):
“Um outro fenômeno de memória bem conhecido refere-se ao fato de que os indivíduos muito mais reconhecem coisas do que lembram delas. Além disso, certos tipos de informações são mais fáceis de reconhecer que outras. Em particular, as pessoas são eficientes em reconhecer milhares de figuras, mesmo que antes as tenham visto apenas brevemente.”
Aplicando este raciocínio à lógica de interfaces gráficas, como a da Realidade Aumentada, pode-se dizer que metáforas visuais são as grandes responsáveis pela recuperação de informações de forma simplificada. Um ícone na área de trabalho, uma janela, um comando de voz, um contato específico do dedo com a tela de um dispositivo: são todos exemplos de metáforas criadas para navegarmos pelo espaço informacional digital.
E, por exemplo, se cada comando no computador (como abrir uma nova janela de navegação) ainda fosse executado por linhas de código, o desgaste mental para acessá-los seria muito maior que o desgaste gerado por lembrar-se apenas da localização de um ícone na área de trabalho.
Vale lembrar, também, que qualquer processo mental consome energia. O desgaste não seria maior apenas pelo trabalho maior para acessar mapas que foram armazenados, mas também por conta de consumo energético:
“Processamento de informações requer energia. Isso é óbvio para qualquer um que tenha prolongado a vida útil da bateria de um laptop desacelerando o processador e restringindo seu acesso às informações do disco. Pensar também é dispendioso.” (PINKER, 1998, p. 150)
Esse é um aspecto que mostra-se relevante para o projeto de qualquer tipo de interface, incluindo projetos em Realidade Aumentada. A forma como o usuário deve acessar a informação pode ser facilitada se a forma como as informações são estocadas e acessadas no cérebro for levada em consideração.
Percepção
Neste capítulo será apresentado o conceito de percepção por meio do Cognitivismo. Ainda que a filosofia também trabalhe com seu conceito em fenomenologia, suas discussões fogem da proposta deste trabalho.
A percepção é um conjunto de processos que permite “reconhecer, organizar e entender as sensações provenientes dos estímulos,” (STERNBERG, 2009, p. 65) e portanto compreende grande parte da cognição. Como antevisto, com a percepção dos estímulos (ambientais ou emocionais), o corpo sofre certos efeitos.
Este processo se baseia, primeiramente, na identificação e qualificação das sensações. Enquanto a sensação apenas detecta a presença de algum objeto ou evento no ambiente ao redor do sujeito – pode-se ver uma folha cair ou sentir o vento passando pela pele –, a percepção se preocupa em qualificar o objeto ou evento – em qual lugar a folha cai, para qual direção o vento sopra. (KIHLSTROM, 2008)
De imediato, a percepção revela a experiência e a categoriza. “A percepção ocorre à medida que os objetos ambientais oferecem a estrutura do meio informacional, que, finalmente, atinge os receptores sensoriais, levando à identificação do objeto” (STERNBERG, 2009, p. 21).
O caminho simplificado desse processo pode ser assim descrito: o objeto ou evento aparecem ou ocorrem no ambiente. Esse primeiro estímulo é chamado de Distal. Esses objetos enviam algum tipo de padrão de energia aos receptores sensoriais (como as ondas de luz refletidas por um material qualquer), caracterizando o estímulo Proximal. A partir daí, o processo torna-se interno. Com a transdução, os receptores sensoriais transformam o estímulo proximal em um padrão de impulsos nervosos. No cérebro, o impulso neural é transmitido ao córtex. E, então, a percepção é constituída, criando representações mentais (mapas e imagens) dos estímulos distais, analisando, identificando e categorizando-os (KIHLSTROM, 2008; STERNBERG, 2009).
Essa é uma categorização genérica sobre todos os processos de percepção. Aqui, o foco será a percepção visual, ainda que os outros sentidos também influenciem no processo como um todo – também são mapeados, geram imagens e respostas emocionais – e tenham importância fundamental para o processo de mapeamento, reconhecimento, evocação da memória etc.
A visão, segundo David Marr, soluciona problemas a partir de seu poder de suposição e é um “processo que produz, a partir de imagens do mundo externo, uma descrição que é útil para quem vê, e não juncada de informações irrelevantes” (MARR, 1982 apud. PINKER, 2006, p. 229). Assim, a visão possui a capacidade de deduzir as formas dos objetos e relacioná-las a imagens mentais. Mais que isso:
“Ele cria uma descrição ou representação do mundo, expressa em objetos e coordenadas tridimensionais em vez de em imagens retinianas, e a inscreve em um quadro-negro que pode ser lido por todos os módulos mentais.” (PINKER, 2006, p. 230)
E a fim de organizar todos os estímulos no cérebro, a visão tem algumas formas particulares de levar a informação do ambiente: a partir de indícios bi e monoculares. Dentre eles podemos citar:
“- Convergência (ângulos diferentes para cada distância) – binocular;
– Disparidade retinal (duas visões diferentes de um mesmo objeto) – binocular ;
– Acomodação (foco dado em um objeto, produzido pelos músculos) – monocular;
– Tamanho relativo do objeto (quanto maior a distância, menor o objeto e vice-versa) – monocular;
– Superimposição (objetos mais próximos da visão sobrepõe os que estão mais distantes) – monocular;
– Perspectiva linear (deformação de acordo com pontos de fuga) – monocular;
– Elevação (objetos distantes tendem a se aproximar da linha do horizonte) – monocular;
– Perspectiva atmosférica (quanto mais distantes, mais embaçados parecem os objetos pelo fato de haver mais sujeira e umidade no intervalo) – monocular;
– Texturas (as texturas aparecem mais detalhadas em objetos mais próximos) – monocular;
– Sombras (posição relativa das sombras de acordo com a relação objeto/luz) – monocular” (KIHLSTROM, 2008).
Essas características são largamente exploradas pelas artes visuais, de pinturas à renderizações de animações tridimensionais. A mimetização dessas características já permite que a visão decodifique o objeto como tridimensional, com determinadas distâncias e propriedades.
A percepção, porém, depende de outros aspectos para constituir-se como processo. Segundo Jerome Bruner (In: OYARBIDE, 2003, p. 1), psicólogo cognitivo:
“(…) hay dos tipos de determinantes en la percepción:
– Formales: las propiedades de las estimulaciones y del aparato receptor.
-Funcionales: las necesidades, emociones, actitudes, valores y experiencias del perceptor”[15] .
Isto é, fatores subjetivos também influem sobre a experiência. O conhecimento, para Bruner, é fundamental a partir do momento em que o indivíduo constrói de fato a cena em sua a cabeça e em que sabe o que é cada elemento que a compõe. Manifestam-se aqui, portanto, a importância da memória e da evocação de mapas que foram armazenados, o self e a influências das emoções nos processos cognitivos.
Atenção
“… os verdadeiros problemas da comunicação moderna decorrem das limitações da atenção humana” (NORMAN, 2004, p. 181)
A atenção é um processo cognitivo que merece destaque quando falamos de comunicação atualmente. Não por ser de fato mais relevante, afinal processos cognitivos e emoções são interdependentes e interligados, mas pela importância que desempenha frente às formas de comunicação modernas.
Para Lévy a vida econômica, pós indústria cultural, passa a depender
“da qualidade e da intensidade da atenção do público. As duas grandes operações das indústrias da cultura e da comunicação são, portanto: (1) a criação direta de estados mentais pela produção e distribuição de experiências virtuais; (2) a direção da atenção do público” (LÉVY, 2004, p.176).
Esse espaço mental é também afetivo. Podemos considerar, então, que trata-se da criação de estados emocionais programados a fim de atrair, direcionar e estabilizar a atenção de um público. No espaço virtual, essa atenção necessita de uma boa orientação para o usuário, o que o torna um espaço que abriga diferentes fluxos de atenção – de diversos públicos direcionados à diversas ideias (LÉVY, 2004).
Mas a questão da atenção implica também em conhecer seus limites. A atenção:
“A tomada de posse pela mente, de modo claro e vívido, de um entre o que parecem ser vários objetos ou linhas de pensamento simultaneamente possíveis (…) Implica em se afastar de algumas coisas para lidar efetivamente com outras.” William James (In: STERNBERG, 2009, p. 107)
A atenção é o que permite o foco da mente em um pensamento ou atividade. Para compreender melhor esse fenômeno, é preciso voltar aos conceitos de protosself (nível mais básico do self, que se dedica aos estados do organismo) e self central (segundo estágio do self, que se preocupa com a interação do organismo com o ambiente).
A cada momento que interagimos com um objeto qualquer, o protosself é alterado, uma vez que o cérebro precisa ajustar o corpo de forma adequada – e os resultados desse ajuste são enviados ao protosself. Uma das consequências desse processo é a geração de um sentimento de “destaque” para o objeto da interação, “uma convergência de recursos de processamento para um objeto específico mais que para outros” (DAMÁSIO, 2009, p. 251).
Esse processo, segundo Norman, também sofre interferências diretas das emoções.
Quando o estado afetivo está negativo, os neurotransmissores influenciam o cérebro a dar foco em um problema, evitando distrações, e gerando alterações no corpo (como tensionar os músculos).
“O foco se refere à capacidade de se concentrar sobre um tópico, sem distração, e então examinar cada vez mais profundamente o assunto (…) O foco também implica concentração nos detalhes” (NORMAN, 2004, p. 46).
Quando o estado afetivo está positivo, ocorre o contrário: os neurotransmissores estimulam o cérebro a ampliar o processamento, os músculos relaxam e a concentração é reduzida. Nesse estado, o cérebro está mais receptivo a interrupções.
A atenção consciente é parte do nível reflexivo. Porém, ela pode ser desviada por mudanças no ambiente:
“O resultado dessa distração natural é uma capacidade de atenção abreviada: novos acontecimentos continuamente atraem a atenção (…) o pronto desvio da atenção é uma necessidade biológica, desenvolvido ao longo de milhões de anos de evolução como um mecanismo protetor contra um perigo inesperado: essa é a função principal do nível visceral” (ibid., p. 181).
Com isso, percebemos um limite da atenção consciente e um ponto fundamental, inclusive ético, para o desenvolvimento de novas formas de comunicação.  Reclamações sobre propagandas nas páginas de web ou pop-ups já são comuns. E, considerando o funcionamento da atenção, esse incômodo tem fundamento.
Por exemplo, o usuário precisa concentrar-se na leitura de um texto que está disponível em uma página qualquer da internet. Ele começa a ler o texto e focar sua atenção (conscientemente) na leitura. Ao rolar a página, porém, surge um banner de propaganda com cores vivas e animações. Nesse momento o cérebro interpreta esse estímulo como uma mudança no ambiente, e volta sua atenção para o banner.
Esse processo é automático, faz parte de uma reação do nível visceral. O usuário pode voltar sua atenção para o texto novamente (um esforço do nível reflexivo), mas a capacidade de concentração provavelmente é abalada pelo estímulo contínuo da animação que aparece ao lado do texto.
Porém, como a maioria das atividades do dia não necessita da atenção consciente em tempo integral, conseguimos dividir a atenção entre as diversas distrações que surgem. “A virtude dessa divisão de atenção é que nos mantemos em contato com o ambiente: estamos continuamente tendo a percepção de coisas ao nosso redor” (ibid., p. 183).
Para a interação social essa capacidade de lidar com distrações se faz até necessária. Uma questão preocupante, no entanto, é que essa divisão funciona bem entre os níveis reflexivo e visceral. A dificuldade surge quando precisamos realizar atividades mecânicas (como dirigir um carro), quando algumas respostas imediatas podem ser necessárias. Em momentos como esse, é preciso ter atenção plena.
Esse limite da atenção consciente e automática é de extrema relevância para ambientes de Realidade Aumentada, como discutido nas análises a seguir, e deve ser parte de uma preocupação ética ao se pensar e projetar ambientes virtuais.
4. Estudo de Casos
Visto o mecanismo dos principais processos cognitivos e da influência das emoções na interação, faremos uma análise de alguns projetos de Realidade Aumentada. Cada caso traz um tipo diferente de interação com o sistema.
Caso 1: Projeção em tela
O primeiro caso, e talvez o sistema mais simples de Realidade Aumentada, é a projeção em monitor. São necessários apenas um display e uma câmera que rastreie uma imagem-alvo (target), onde são sobrepostos os objetos virtuais. O targets são imagens aleatórias registradas no sistema que, ao serem reconhecidas, funcionam como uma espécie de registro para a animação ou objeto 3D a que foi atrelada. As instruções geralmente indicam que as imagens devem ser impressas em papel fosco, pois o reflexo de luz pode comprometer a leitura da imagem. Mesmo assim, é possível que a imagem-alvo seja mostrada em materiais refletores, como em celulares ou tablets.
A facilidade desse sistema se dá justamente por ele depender de dispositivos bastante difundidos: dispositivos de entrada podem ser webcams ou câmeras acopladas em celulares; os de saída são monitores, televisores ou displays. Com isso, diversos sites e empresas já utilizaram a tecnologia.
Em 2009 a GE Imagination, da General Eletrics, disponibilizou um hotsite do projeto ecoimagination, que destina-se a pensar inovações sustentáveis para geração de energia. Uma das abas do site trazia um sistema de Realidade Aumentada que permitia que o usuário apontasse a imagem-alvo para a webcam e visualizasse duas animações: uma ilustra a geração de energia solar e a outra, energia eólica. Ambas são acompanhadas por trilha sonora.

Figura 12: Hotsite Ecoimagination com instruções para a Realidade Aumentada.Fonte: GE Ecoimagination. Disponível em: http://ge.ecomagination.com/smartgrid/#/augmented_reality, acesso em 05 abr. 2013.

Figura 13a: Animação de Usina Eólica em Realidade Aumentada. Fonte: Reprodução do vídeo “Augmented REality Demo”. Disponível em: http://www.augmentedplanet.com/2009/05/ge-augmented-reality-demo/. Acesso em  05 abr. 2013

Figura 13b: Animação da obtenção de energia solar em Realidade Aumentada. Fonte: Reprodução do vídeo “Augmented REality Demo”. Disponível em: http://www.augmentedplanet.com/2009/05/ge-augmented-reality-demo/. Acesso em 05 abr. 2013
Outro exemplo de aplicação desse sistema no mercado foi a cabine utilizada pela LEGO em 2009. A Lego Digital Box Kiosk, desenvolvido pela empresa Metaio, consistia em um totem com um monitor e câmera embutida montado no ponto de venda, conforme Figura 14.

Figura 14: Totem da Lego para Realidade Aumentada. Fonte: Metaiol. Disponível em: http://www.metaio.com/kiosk/lego/. Acesso em 05 abr. 2013.
Ao identificar a imagem da embalagem, o sistema rodava uma animação do brinquedo no monitor. Cada brinquedo tinha uma animação temática diferente:

Figura 15a: Lego Digital Box Kiosk. Fonte: Metaio. Disponível em: http://www.metaio.com/kiosk/lego/. Acesso em 05 Abr. 2013.

Figura 15b: Lego Digital Box Kiosk. Fonte: Metaio. Disponível em: http://www.metaio.com/kiosk/lego/. Acesso em 05 Abr. 2013.
As imagens targets, porém, não precisam necessariamente estar impressas em dimensões reduzidas. Outro projeto da General Eletrics, o “Projeto Galeria GE”, que foi lançado em 2012, fazia de um grande mural instalado na cidade de São Paulo o seu target. O projeto espalhou três painéis pela cidade, localizados na Avenida Paulista, Rua Amauri e Rua da Consolação que retratavam os temas saúde, energia e transporte.
O painel produzido pelo Estúdio Colletivo, que estava localizado na rua Amauri, ganhou uma animação em Realidade Aumentada. Com o aplicativo para iPod, iPhone e iPad desenvolvido para o projeto, o sujeito apontava a câmera para o painel e a animação era executada na tela de seu dispositivo.

Figura 16a: Animação em Realidade Aumentada para o Projeto Galeria GE. Fonte: GE Reports Brasil. Disponível em: http://brazil.geblogs.com/arte-a-ceu-aberto/. Acesso em 05 abr. 2013.

Figura 16b: Animação em Realidade Aumentada para o Projeto Galeria GE. Fonte: GE Reports Brasil. Disponível em: http://brazil.geblogs.com/arte-a-ceu-aberto/. Acesso em 05 abr. 2013.
No caso de aplicativos para dispositivos com displays sensíveis ao toque, como tablets e alguns aparelhos celulares, o sistema pode permitir interação com a animação. É o caso do aplicativo String, desenvolvido para o sistema iOS. Há quatro imagens (que funcionam como os targets) disponíveis para download (no site http://www.poweredbystring.com/showcase. Acesso em 05 abr. 2013), e cada uma traz uma animação diferente.
Uma das imagem-alvo leva o sistema a uma tela em branco: o usuário escolhe uma cor e desenha em 3D. Esse exemplo ilustra para o usuário como a interação pode inscrever elementos no espaço virtual de forma tridimensional. Além disso, há liberdade total de criação. Os gráficos ainda não apresentam um render de alta qualidade, mas a experiência é interessante por mostrar o resultado da interação.

Figura 17: Desenhos em Realidade Aumentada com o aplicativo String. Fonte: String. Disponível em: http://www.poweredbystring.com/showcase. Acesso em 05 abr. 2013.
Análise do Caso 1
Talvez o grande elemento desse sistema seja o sentimento de surpreender-se. O fato de que uma imagem qualquer pode ser resignificada no mundo virtual desencadeia não só emoções nos três níveis de processamento. No nível visceral, pela atração visual que as imagens tridimensionais (e, por vezes, animadas) podem causar, as animações da Lego que aparecem sobre a embalagem do Digital Box geram afetividade não apenas por serem tridimensionais ou animadas, mas por sua aparência.
Assim, a animação no caso dos sistemas da Lego e da GE Imagination acabam despertando a atenção automática – especialmente porque em momentos de afetividade positiva, o cérebro se torna mais receptivo a interferências. Esses dois exemplos, ainda, apresentam uma boa relação de usabilidade por serem extremamente simples (rotacionando a imagem-alvo, a animação também é rotacionada na tela), o que gera afetividade no nível comportamental.
O “Projeto Galeria GE” também traz reações afetivas muito parecidas com as do exemplo anterior. Seu destaque aqui se dá pelo fato de ser um representante de mídias locativa, o que significa que esta experiência está atrelada a um local específico. Com isso, essa experiência se torna um evento coletivo e compartilhado. O sistema da LEGO também acontecia em público – porém a experiência era individual e referia-se à embalagem. Aqui, o objeto resignificado é um espaço público e a relação de mobilidade também compõe a experiência. Isso pode gerar afetividade no nível reflexivo pelo fato do parâmetro ser cultural – o indíviduo pode ou não ter aquela experiência. E tê-la reflete na noção de auto-imagem.
O quarto exemplo apresentado, o desenho tridimensional do aplicativo String, permite interação do usuário. Essa interação é mapeada no cérebro e é registrado que, ao deslizar o dedo sobre o display do dispositivo, são criadas imagens coloridas e tubulares, que mimetizam os movimentos do dedo e são inscritas em uma camada virtual sobreposta ao ambiente em que o usuário está inserido.
Quanto aos processos cognitivos, o primeiro passo após o mapeamento da interação e da percepção é uma espécie de desambiguação. O processo de desenho ao qual estamos habituados, que aprendemos na escola e usamos no cotidiano, é bidimensional. Segurar uma caneta e escrever ou desenhar em softwares de computador geram imagens em duas dimensões.
Como a interação exige que o usuário desenhe sobre o display e veja o resultado disso na tela, memórias são evocadas e o cérebro logo reconhece isso como uma forma de desenho. Porém, assim que há percepção (ou consciência) de que esses desenhos são tridimensionais um mapeamento específico para este caso é gerado e arquivado. Especialmente porque o deslocamento do dispositivo pelo espaço (real) permite que o desenho seja inscrito em qualquer espaço entre os eixos X, Y e Z – portanto essa interação exige um aprendizado motor e cognitivo.
Poder tocar o objeto para esta interação pode parecer um detalhe de adaptação do sistema, mas a sensação física é tão importante quanto o bom funcionamento do aplicativo. Afinal, segundo Norman (2004, p.102):
“Somos criaturas biológicas, com corpos físicos, braços e pernas. Uma parte enorme do cérebro é ocupada pelos sistemas sensoriais, continuamente investigando e interagindo com o ambiente”.
Ou seja, o mapeamento que o cérebro desempenha está sempre preocupado também com as sensações táteis do ambiente. Esse fato, inclusive, tem importância para a noção de self – especificamente, em seu segundo estágio, o self central.
Outro detalhe importante deste exemplo é a presença de uma sombra na linha desenhada, que ajuda (ou engana) a visão a perceber que se trata de um objeto tridimensional. Mesmo que o usuário tenha consciência disto, um único indício para a visão já é suficiente para que haja o reconhecimento da terceira dimensão no sistema.
Caso 2 – Projeção Ótica Direta
Em 2013, a Google lançou sua primeira versão do Project Glass, um óculos monocular de Realidade Aumentada. Com um display e uma câmera acoplada, o dispositivo possui diversas funcionalidades, como fazer ligações, vídeo chamadas, tirar fotos, gravar vídeos, obter informações gerais como data e horário.
Seu display foi projetado para a visão monocular, como visto no capítulo 2.2, o que causa menos fadiga aos olhos que um Head-Mounted Display binocular.
Este projeto permite que o usuário tenha mobilidade e permaneça conectado à rede em tempo integral, pois fica em standby. É um sistema mais complexo a partir do momento que a visão real do sujeito independe de local, de imagens-alvo ou qualquer outro suporte real, além do próprio óculos.

Figura 18a: Google Project Glass. Fonte: Reprodução do vídeo “Glass How-To: Getting Started”. Disponível em: http://www.youtube.com/watch?v=4EvNxWhskf8. Acesso em 14 abr. 2013.
Há um touchpad na lateral que permite ao usuário navegar pelo sistema. Com um toque, o óculos é ativado (sai do modo standby) e um painel, espécie de menu principal, é mostrado. Esse menu desliza horizontalmente, e a opção central é destacada – é a posição que, com um toque no touchpad, seleciona o aplicativo que está sendo mostrado. Além disso, o óculos responde a comandos de voz.

Figura 18b: Google Project Glass – Touchpad. Fonte: Reprodução do vídeo “Glass How-To: Getting Started”. Disponível em: http://www.youtube.com/watch?v=4EvNxWhskf8. Acesso em 14 abr. 2013.

Figura 18c: Google Project Glass – Interface do menu inicial. Fonte: Reprodução do vídeo “Glass How-To: Getting Started”. Disponível em: http://www.youtube.com/watch?v=4EvNxWhskf8. Acesso em 14 abr. 2013
Análise do Caso 2
Quanto à cognição, a primeira questão que parece relevante é a da atenção. Por mais que seja consciente, ou seja, o sujeito escolhe voltá-la à interação com o sistema, interferências no ambiente podem levar a uma mudança de foco natural desse processo. O inverso, porém, também pode acontecer. Por exemplo, em uma conversa, o óculos pode ser ativado e, por conta da série de novas informações projetadas na retina, desviar o foco principal da atenção.
Para o usuário, essa noção pode ser nebulosa, no entanto. Ele tem a percepção de estar no ambiente com a pessoa com quem conversa, tem consciência do assunto que está sendo discutido. O mapeamento do cérebro dizem ao protosself e ao self central que ele está presente no contexto: o primeiro entende que o organismo está vivo, o segundo que esse organismo está imerso e em interação com o ambiente. A afetividade, porém, está na interação com o sistema.
Enquanto as atividades na Realidade Aumentada são mecânicas – por exemplo, o usuário querer acessar o sistema para procurar um arquivo armazenado -, a atenção que acontece no nível reflexivo – a conversa – pode continuar vigente. Não encontramos muitas dificuldades quando as atenções estão divididas por níveis de processamento. Mas, se o sistema, por exemplo, mostrar uma mensagem para o usuário (que exige leitura, compreensão e resposta), o foco deixa de ser a conversa.
Isto pode ter consequências não só sociais, como pode atrapalhar alguns reflexos naturais. Ao andar na rua, por exemplo, processamos a imagem de todo o ambiente. Quando a atenção está focada, conscientemente ou não, o objeto de foco passa a ser o “primeiro assunto”, e todas as outras questão ficam em segundo plano – inclusive o mapeamento do ambiente. É possível que, com a atenção voltada para a RA, pequenos acidentes (tropeços, por exemplo) aconteçam.
Outra questão fundamental é a da percepção: como observado por Steve Mann, em seu projeto da Diminished Reality, o ambiente real já apresenta muitos elementos, sendo complexo o suficiente para criar ainda mais elementos sobrepostos. Informações simplificadas, além de não sobrecarregarem ainda mais o mapeamento do ambiente – agora aumentado – geram um outro entendimento de interação.
Uma cadeira virtual tridimensional, com um render que a faça parecer um objeto real, considerando as características da visão estereoscópica, poderia causar confusão. Mais que isso, poderia gerar uma reação emocional negativa: já que não é tangível, não tem textura e pode não ter som, pode causar frustação.
Em uma interface, principalmente para projetos como o Project Glass, é relevante que se considere a utilização de imagens abstratas e simplificadas. O aprendizado do mundo real que desenvolvemos ao longo da vida, bem como o aprendizado das interfaces gráficas que estamos habituados, pode (e deve) servir de base para uma interface agradável.  Utilizar-se desse aprendizado garante que a navegação seja mais intuitiva, dependendo menos de novos aprendizados. Como no exemplo do desenho tridimensional da String, o cérebro reconhece o processo na memória e não é preciso mapear a interação novamente.
Mas mimetizar a realidade, criando uma espécie de simulacro, é uma alternativa que além de sobrecarregar ainda mais o mapeamento do ambiente, poderia causar confusões e reações emocionais negativas.
5. Considerações Finais
A Realidade Aumentada sem dúvidas traz uma nova forma de comunicação digital, quando comparada a como se dão as relações com o espaço-virtual por meio de computadores ou dispositivos móveis (celulares e tablets, por exemplo).
Mas, para consolidar-se, é preciso que seu projeto considere sempre que os usuários finais são seres humanos, dotados de um cérebro com capacidades incríveis de processamento, mas que também possui limites.
Por outro lado, seria uma visão anacrônica, ou presa ao tempo, imaginar que os níveis de evolução foram estancados. Ao contrário, a evolução continua acontecendo, “possivelmente enriquecido e acelerado pelas pressões criadas pelo autoconhecimento” (DAMÁSIO, 2009, p. 227). Ainda,
“A atual revolução digital, a globalização das informações culturais e o amadurecimento da empatia são pressões que tendem a impulsionar modificações estruturais da mente e do self, (…) nos próprios processos cerebrais que moldam a mente e o self” (ibid., p.227)
As modificações vêm a partir dos próprios processos da mente, quando afrontados a novas e mais complexas situações – ainda que digitais. Afinal, evoluímos para interagir uns com os outros, e com uma capacidade de dividir essa atenção com diversas outras atividades. O que a evolução não poderia prever, no entanto, é que a comunicação (e a interação) passariam a ser à distância, com projeções virtuais.
Como antevisto, o cérebro mapeia constantemente o corpo e o ambiente em que o organismo se insere. A percepção de estar em um ambiente real é confirmada pelos sentidos como o tato ou olfato.  A percepção visual, no entanto, é facilmente enganada: segundo o nível visceral, vejo o ambiente real (ainda que por meio de uma tela) e esta visão me diz que, de fato, estou presente e interferindo no ambiente. O nível comportamental também aceita essa ideia, uma vez que a interação pode acontecer também com uma superfície sensível dos dispositivos – como na interação em displays multitouch ou no Project Glass da Google.
O nível reflexivo, entretanto, refuta essa impressão e relembra que a interação na Realidade Aumenta é fruto de um sistema e que foi utilizado (e em alguns casos, procurado) conscientemente a fim de provocar a sensação de “interação com o ambiente real com o virtual”. O grande atrativo do sistema de Realidade Aumentada, então, é esse constante conflito entre os níveis visceral, comportamental e reflexivo.
Outro aspecto fundamental que deve ser considerado é a questão da tangibilidade da interação que, pelo menos por ora, ainda se faz importante para o aprendizado de apropriação, mobilidade e interação efetiva em ambientes de Realidade Aumentada. É, de certa forma, frustante ter interação com objetos virtuais e não poder sentí-los ou ter reações muito básicas para a interação. Por exemplo, talvez ao clicar em um link ou botão em Realidade Aumentada, sua reação deva ir além de um simples efeito visual de “afundar” (ou qualquer outro efeito). Talvez mais estímulos emocionais, como sons, possam complementar essa relação na interface, numa tentativa de suprir a falta que o toque pode gerar. Ainda assim, a sensação do toque não seria substituída.
Essa relação do toque fala principalmente aos primeiro e segundo emocionais (ou estruturas do self). O que poderia fazer com que a interação que privilegia a visão e a audição se popularizasse é a relação reflexiva, que não apenas busca superar limites dos níveis inferiores (como buscar prazer em alturas, filmes de terror etc), como está relacionado a uma série de padrões culturais que exercem influência sobre o entendimento (e o valor) do objeto.
Novamente, o fundamental é que esses desafios ou “brincadeiras” emocionais geradas pela Realidade Aumentada nunca desrespeitem os limites biológicos, cognitivos do cérebro. Da mesma forma, devem respeitar princípios éticos estabelecidos, por mais que a moral e a ética sejam cambiantes. Afinal, qualquer projeto comunicacional é feito para seres humanos, que se organizam em sociedades. Cada um com sua individualidade, cada grupo com suas características específicas – mas todos humanos.
Referências Bibliográficas
AZUMA, R.  A Survey of Augmented Reality. Presence: Teleoperators and Virtual Environments.  Cambridge, 1997, v. 6, n. 4. Disponível em: http://www.ronaldazuma.com/papers/ARpresence.pdf. Acesso em: 01 out. 2012.
AZUMA, R. et .al. Recent Advances in Augmented Reality. IEEE Computer Graphics and Application. 2001, v. 21, n.6, p. 34-47. Disponível em: http://www.cs.unc.edu/~azuma/cga2001.pdf. Acesso em: 05 out. 2012.
BRAGA, Marta C.G. Diretrizes para o design de mídias em realidade aumentada: Situar a aprendizagem colaborativa online. 2012
CARDOSO, Rafael. Design para um Mundo Complexo. São Paulo: Cosac Naify, 2012.
DAMÁSIO, António. E o cérebro criou o homem. São Paulo: Companhia das Letras, 2011.
JOHNSON, Steven. Cultura da interface: como o computador transforma nossa maneira de criar e comunicar. Rio de Janeiro: Jorge Zahar Ed., 2001.
HANSEN, Mark. Bodies in code: interfaces with digital media. Nova Iorque: Routledge, 2006.
KIHLSTROM, John F. Psych 1 – General Psychology – Lecture 8. 2008. Sensation and Perception. [online]. Visto em 11 out. 2012. Disponível em: http://www.youtube.com/watch?v=Wue0F35b9d0. Acesso em 14 nov. 2012.
KIRNER, C.; KIRNER, T.G. Evolução e tendências da Realidade Virtual e da Realidade Aumentada. In M. W. de S. Ribeiro, E. R. Zorzal, EDS. 2011. Realidade Virtual e Aumentada: Aplicações e Tendências. XIII Symposium on Virtual and Augmented Reality. Uberlândia: Sociedade Brasileira de Computação – SBC, 2011.
KIRNER, Claudio; SISCOUTO, Robson. Realidade Virtual e Aumentada: conceitos, projetos e aplicações. Petrópolis: Livro do Pré-Simpósio IX Symposium on Virtual and Augmented Reality, 2007.
LEMOS, André; JOSGRILBERG, Fabio. Comunicação e Mobilidade. Salvador: 2009.
LEMOS, André. Estéticas Tecnológicas. Mídia Locativa e Territórios Informacionais. São Paulo: Ed. PUC/SP, 2007.
LÉVY, Pierre. In: O ciberespaço e a economia da atenção. In: PARENTE, André (org.). Tramas da Rede: novas dimensões filosóficas, estéticas e políticas da comunicação. Porto Alegre : Sulina, 2004. p. 174-188.
NETTO, Antonio Valerio; MACHADO, Liliane dos Santos; OLIVEIRA, Maria Cristina F. de. Realidade virtual – fundamentos e aplicações. Florianópolis: Visual Books, 2002.
MILGRAM, P.; KISHINO, F. A taxonomy of mixed reality visual displays. IEICE SEARCH SYSTEM, Tokyo, 1994a, v. E77-D, n. 12, pp. 1321- 1329.Disponível em: http://www.eecs.ucf.edu/~cwingrav/teaching/ids6713_sprg2010/assets/Milgram_IEICE_1994.pdf. Acesso em: 27 mar. 2011.
MANN, Steve. Wearable Computing. In: Soegaard, Mads and Dam, Rikke Friis (eds.). The Encyclopedia of Human-Computer Interaction, 2nd Ed. Aarhus, Denmark: The Interaction Design Foundation, 2013. Disponível em: http://www.interaction-design.org/encyclopedia/wearable_computing.html. Acesso em 19 jan. 2013.
MAROLDI, Marcelo M. Computação e Cognição. Ciências & Cognição. Rio de Janeiro, 2006, v. 7, ano 3. Disponível em: http://www.cienciasecognicao.org/revista/index.php/cec/article/view/563/350. Acesso em 04 out. 2012.
NORMAN, Donald. Design emocional: porque adoramos ou detestamos os objetos do dia-a-dia. Rio de Janeiro: Rocco, 2008.
NORMAN, Donald. O design do futuro. Rio de Janeiro: Rocco, 2010.
OYARBIDE, Mikel A. Revista Iberoamericana de Educación . Jerome Seymour Bruner: de la percepción al lenguaje. Madrid, 2003, número 33. Disponível em: http://www.rieoei.org/deloslectores/749Aramburu258.PDF. Acesso em 13 nov. 2012.
PINKER, Steven. Como a mente funciona. São Paulo: Companhia das Letras, 1998.
PREECE, J.; ROGERS, Y.; SHARP, H. Design de interação. Porto Alegre: Bookman, 2005.
STERNBERG, Robert J. Psicologia Cognitiva. Porto Alegre: Cengage Learning, 2000.
SIBILIA, Paula. El hombré postorgánico: cuerpo, subjetividad y tecnologías digitales. Buenos Aires: Fondo de Cultura Económica, 2005.
TORI, Romero; KIRNER, Claudio; SISCOUTO, Robson.  Fundamentos e Tecnologia da Realidade Virtual e Aumentada. Belém: Editora SBC, 2006.
[1] Esse fato também a difere da multimídia, que pode ser entendida como a integração de mídias a fim de representar, armazenar, transmitir e processar informações digitalmente (MARSHAL, 2001 apud. TORI, KIRNER, 2006, p. 07). Além disso, a multimídia se utiliza de imagens pré-processadas ou capturadas, em duas dimensões e que funcionam em dispositivos convencionais.
Ainda que a RV também utilize diversos tipos de mídia, como imagens, animações, áudio etc, suas imagens são geradas (ou renderizadas) em tempo real e seus modelos são entidades tridimensionais que necessitam de dispositivos especiais para visualização e interação. (TORI, KIRNER. 2006)
[2] “O conceito de “continuum virtual” se refere à mistura de tipos de objetos apresentados em qualquer situação de exposição particular, (…) onde ambientes reais, são mostrados em uma extremidade do continuum, e ambientes virtuais, no lado oposto. O primeiro caso, à esquerda, define ambientes constituídos apenas por objetos reais (…) e inclui, por exemplo, o que pode ser observado em um monitor de vídeo convencional de uma cena do mundo real. Um exemplo adicional inclui a visualização direta do real da mesma cena, (…). O último caso, à direita, define ambientes constituídos apenas por objetos virtuais (…), um exemplo do que seria uma simulação gráfica em computador. (…) a forma mais simples de entender um ambiente de realidade misturada, portanto, é a de que os objetos do mundo real e mundo virtual se apresentam juntos dentro de um único display, ou seja, em qualquer lugar entre os extremos do continuum virtual.” Tradução da autora.
[3] “O diagrama original de Milgram (…) mostrando a transição do real para o virtual, é uma abordagem conceitual, embora tenha sido introduzido no contexto de uma discussão de displays de realidade aumentada, na década de 1990.” (KIRNER;KIRNER, 2001, p.21).
[4] A Realidade Aumentada permite que o usuário veja o mundo real, com objetos virtuais sobrepostos ou compondo com o mundo real. Portanto, a RA suplementa a realidade ao invés de substituí-la completamente”. Tradução da autora.
[5] “ – Combina objetos reais e virtuais em um ambiente real;
– funciona de forma interativa e em tempo real; e
– registra (alinha) objetos reais e virtuais uns aos outros.”  Tradução da autora.
[6] A percepção humana e os princípios da visão serão tratados com mais detalhes no capítulo 3.3.
[7] “acessíveis as 24 horas do dia, qualquer que seja sua localização na extensa geografia do mundo físico”. Tradução da autora.
[8] “Tanto a definição como o uso dos espaços sofrem alterações em função desse processamento digital, que dilui a clássica oposição entre as esferas pública e privada. As subjetividades e os corpos contemporâneos se veem afetados pelas tecnologias da virtualidade (…), e pelos novos modos de entender e vivenciar os limites espaço-temporais que estas tecnologias inauguram”. Tradução da autora.
[9] Ver capítulo 3.1
[10] Ver capítulo 3.2
[11] Os “neurônios-espelho” permitem que o cérebro simule um estado do corpo que não está de fato acontecendo no organismo. Por exemplo, um indivíduo, ao observar outro realizando o movimento de levantar o braço, tem suas áreas do cérebro associadas ao movimento de braço ativadas. Ao fazer isso, o cérebro está mapeando a atividade sem que haja consumo de energia para realizar a ação, o que do ponto de vista evolucionista é uma vantagem. (DAMÁSIO, 2011)
[12] Nota-se aqui uma semelhança estreita entre os níveis de processamento e os estágios do self definidos por Damásio, que parecem permitir que as respostas emocionais elencadas por Norman possam acontecer. O protosself é ligado aos sentimentos primordias, que são emoções automáticas ou instintivas. O segundo estágio de self, o self central, é gerado quando a interação com o ambiente altera o protosself – o que desencadeia uma narrativa imagética na mente, estabelecendo uma relação entre as imagens do organismo e as do objeto a ser conhecido. Já o terceiro estágio é o self autobiográfico, que possibilita a subjetividade e a consciência (o que permite a reflexão do indivíduo sobre ele mesmo).
[13] Não se trata aqui da teoria de memória consciente e inconsciente, mas de uma nomenclatura que visa distinguir fases possíveis no processo de evocação de memórias.
[14] Vale assinalar que o processo dos sonhos também se utiliza dessa estrutura inconsciente, mas quando falamos em relembrar de um sonho, estamos falando de um estado diferenciado da consciência, o que não é uma discussão viável para este projeto.
[15] “Existem dois tipos de fatores determinantes na percepção:
– Formais: as propriedades dos estímulos e dos receptores;
– Funcionais: necessidades, emoções, atitudes, valores e experiências do receptor”. Tradução da autora.