Para rematar este curso, imos a analizar as consecuencias, positivas e negativas, que a IA ten e terá na sociedade, especificamente aquelas vinculadas a oportunidades e sostibilidade, aspectos legais, e preocupacións éticas.
Antes de nada podemos realizarnos as seguintes preguntas, como unha axuda para iniciar as nosas reflexións e debates na aula:
A intelixencia artificial podería...
... ter nesgos de sexo, raza ou relixión?
... destruír postos de traballo?
... favorecer aos países enriquecidos?
... influír nas nosas preferencias o gustos?
... aumentar a pegada de carbono?
... decidir quen debe ser salvado ou salvada?
... desafiar a nosa privacidade?
Comezaremos coa visualización deste breve vídeo que forma parte do curso "Inteligencia Artificial y Educación" de Programamos.
Podes premer na seguinte ligazón para acceder ao documento en formato pdf que contén esta unidade: Impacto da IA na Sociedade.pdf.
Estrutura da rede neuronal que utilizaremos nesta práctica.
Nesta 2ª práctica de programación con Python, realizaremos o noso primeiro clasificador de imaxes cunha rede neuronal "normal" (máis adiante utilizaremos unha rede neuronal convolucional, máis axeitada a este tipo de problemas).
Para a realización desta práctica volveremos a acceder aGoogle Colabcunha conta de Google.
Podes seguir esta práctica paso a paso se descargas o seguinte pdf: Clasificador de imaxes.
Neste vídeo se indican os pasos para crear unha rede neuronal que nos permitirá clasificar imaxes, aínda que finalmente veremos que esta opción da resultados limitados e en futuras prácticas utilizaremos redes neuronais convolucionais, máis adaptadas a este tipo de problemas.
Como datos para adestramento e test do noso modelo, utilizaremos un conxunto de imaxes (70.000 de 28x28 píxeles en escala de grises) creado pola tenda de roupa Zalando.
Neste vídeo se indican os pasos para crear unha primeira rede neuronal sinxela (perceptrón) que resolva o problema de coñecer os graos Fahrenheit correspondentes a uns graos celsius dados, para posteriormente indicar como podríamos solucionalo cunha rede neuronal cun maior número de capas e neuronas (aínda que non obteriamos resultados mellores).
Finalmente veremos como este problema se pode solucionar dun xeito máis sinxelo e directo utilizando a ferramenta de regresión lineal da bliblioteca sklearn.
Imos a profundizar no coñecemento e uso da IA, para o cal necesitaremos comezar a programar en Python.
En futuras entradas utilizaremos os cadernos de Google Colab para solucionar diversos problemas de adestramento automático (Machine Learning) programando en linguaxe Python.
Pero antes, imos repasar brevemente cales son os paradigmas de aprendizaxe en adestramento automático, que é Google Colab e cales son as bibliotecas de funcións matemáticas máis utilizadas (Tensor Flow, Keras, etc).
Ademais podedes acceder a un par de páxinas que vos permitirán aprender como os diversos parámetros da rede neuronal (número de capas, número de neuronas por capa, funcións de activación, etc) afectan ao aprendizaxe supervisado.
Nesta práctica imos a utilizar de novo a páxina de Learning ML (LML) para realizar un proxecto de recoñecemento de datos numéricos.
Pero esta vez, accederemos á opción “Proba LearningLML V2” e veremos que aparecen as opcións: Numeros (Recoñecer números) e sons (Recoñecer sons), que utilizaremos nesta práctica.
Nesta entrada se continúa coa análise de ferramentas que usan IA, concretamente analizarás os modelos de xeración e procesado de imaxes.
Utilizarás varias ferramentas para a realización de diversas tarefas, que te permitirán analizalas e comparalas e, por último, realizarás unha entrada no teu blogue que conteña os resultados obtidos.
Pero antes de nada, para coñecer que son as redes neuronais convolucionais (as que permiten traballar con imaxes), podes ver os seguintes vídeos da canle dot.csv:
Lista de modelos de xeración de imaxes que podes usar para o teu traballo:
DALL-E: Esta ferramenta permite xerar imaxes a partir de descricións textuais (incorporada á plataforma de ChatGPT, límite de 3 prompts/día).
Stable Diffusion Web: Xera imaxes realistas e artísticas baseándose en descricións de texto (10 créditos/día).
MidJourneyfree: Especializada na creación de arte dixital e imaxes surrealistas, sendo ideal para proxectos creativos e artísticos.
Leonardo AI: Esta ferramenta transforma fotografías en obras de arte dixital, empregando estilos de artistas famosos como Van Gogh ou Picasso.
Firefly: Plataforma desenvolvida por Adobe, ten un plan gratuíto de 25 créditos mensuais. Non só crea imaxes, tamén pode procesalas.
Ideogram: Accesible con unha conta de Google. Ten un plan gratuíto de 10 créditos/día.
Krea.ai: Plataforma que da acceso a diversas ferramentas de creación de imaxes (Flux, Enhancer, Realtime) e de vídeo.
Let's Enhance: Xenera imaxes e mellora a calidade de imaxes de baixa resolución, aumentando a nitidez e resolución. Ofrece plan gratuíto con 10 créditos.
AI Image Upscaler: Permite aumentar a resolución e mellorar a calidade das imaxes. Na versión gratuíta ofrece 20 créditos.
Actualización (febreiro 2025):
Qwen: Asistente de IA multifuncional deseñado para proporcionar respostas rápidas e precisas. Pode xerar imaxes a partir de texto (prompt).
Napkin.ai: Ferramenta de xeración de imaxes especializada na creación rápida de bosquexos, deseños e diagramas a partir de descricións textuais. Ideal para crear ilustracións conceptuais. Ofrece unha versión gratuíta con funcionalidades básicas e un límite diario de xeracións.
Continuamos a traballar con modelos preentrenados, pero esta vez utilizaremos as habilidades de recoñecemento de imaxes.
Nesta práctica imos a utilizar outra páxina (similar á MLfK), Learning ML (LML) para realizar un proxecto de recoñecemento de imaxes.
Unha vez na páxina inicial, accederemos á opción “LearningML Basic” e veremos un entorno similar ao que xa utilizamos en Machine Learning for Kids, neste caso non teremos que rexistrarnos pero, en contrapartida, deberemos gardar o modelo no noso ordenador para podelo utilizar en futuras sesións.
No vídeo anterior se fai referencia a 2 páxinas web, que permiten comprender máis profundamente como funciona a extracción de características nunha imaxe:
A demostración interactiva de DeepLizard (explica como se aplican filtros para detectar bordos en imaxes).
A ferramenta de Adam Harley (permite debuxar un número e comprobar se o sistema de intelixencia artificial o recoñece correctamente).
Tamén podedes ver o seguinte vídeo sobre a aplicación dos sistemas de recoñecemento de imaxes para traducir a linguaxe de signos en tempo real:
Ao longo deste curso utilizaremos diversos tipos de ferramentas que usan IA, nesta entrada comezamos co análise e uso dos Chatbots, grandes modelos de linguaxe.
Utilizaremos diversos Chatbots para a realización dunha tarefa concreta, crear unha entrada no noso blogue onde realizaremos unha análise de diversos Chatbots gratuítos e accesibles na Web, realizando unha comparativa entre eles e indicando cales foron os puntos fortes e débiles de cada un deles.
ChatGPT (OpenAI): Modelo de linguaxe avanzado que ofrece interaccións conversacionais de alta calidade, ideal para a creación de contido e asistencia en tarefas complexas.
Gemini (Google): É un asistente virtual, integrado no ecosistema de Google, que combina potencia de busca e capacidades de diálogo, permitindo interaccións naturais e informativas.
Perplexity AI: A súa capacidade de buscar información actualizada a partir de diversas fontes o converte na opción ideal para investigacións rápidas, con indicacións de datos de contexto (fontes, etc).
Copilot (Microsoft): Asistente baseado en IA que se integra en aplicacións de Microsoft.
Claude (Anthropic): Claude é un chatbot deseñado para ser intuitivo e seguro, priorizando a ética e a responsabilidade nas súas interaccións.
YouChat (You.com): YouChat está integrado na plataforma de busca You.com, útil para aqueles que unha busca interactiva e personalizada.
Actualización (febreiro 2025):
DeepSeek: Modelo avanzado que combina capacidades de busca profunda con interaccións de diálogo naturais, ideal para tarefas de investigación exhaustiva.
Qwen (Alibabá): Asistente de IA multifuncional deseñado para proporcionar respostas rápidas e precisas, así como para axudar na xestión de tarefas e no acceso á información.
De seguido tedes un vídeo da canle Dot.csv que explica que son os LLM:
¿Qué es un LLM? Enormes Modelos del Lenguaje | Large Language Models
Por último, tedes aquí a ligazón a outro vídeo da canle Dot.csv na que explica o estado actual (principios de 2024) dos LLM como ChatGPT:
Lo que OpenAI NO quería que supieras sobre GPT4 - (De los MoEs a Mixtral)
Para a realización desta práctica imos acceder á aplicación en liña Machine Learning for Kids (MLfK).
Esta ferramenta vainos permitir adestrar unha IA e consta de 3 módulos:
• “Entrenar” (onde engadimos os exemplos de adestramento).
• “Aprender&Probar” (onde se adestra ao modelo).
• “Crea” (xera o código que poderemos exportar a Scratch ou Python).
Crearemos un “detector de sentimentos” que sexa capaz de determinar se estamos felices, tristes ou cansos en función dos nosos comentarios por escrito, posteriormente exportaremos o código e engadiremos esta función a un programa de Scratch creado por nós.