Nesta práctica imos a utilizar de novo a páxina de Learning ML (LML) para realizar un proxecto de recoñecemento de datos numéricos.
Pero esta vez, accederemos á opción “Proba LearningLML V2” e veremos que aparecen as opcións: Numeros (Recoñecer números) e sons (Recoñecer sons), que utilizaremos nesta práctica.
Nesta entrada se continúa coa análise de ferramentas que usan IA, concretamente analizarás os modelos de xeración e procesado de imaxes.
Utilizarás varias ferramentas para a realización de diversas tarefas, que te permitirán analizalas e comparalas e, por último, realizarás unha entrada no teu blogue que conteña os resultados obtidos.
Pero antes de nada, para coñecer que son as redes neuronais convolucionais (as que permiten traballar con imaxes), podes ver os seguintes vídeos da canle dot.csv:
Lista de modelos de xeración de imaxes que podes usar para o teu traballo:
DALL-E: Esta ferramenta permite xerar imaxes a partir de descricións textuais (incorporada á plataforma de ChatGPT, límite de 3 prompts/día).
Stable Diffusion Web: Xera imaxes realistas e artísticas baseándose en descricións de texto (10 créditos/día).
MidJourneyfree: Especializada na creación de arte dixital e imaxes surrealistas, sendo ideal para proxectos creativos e artísticos.
Leonardo AI: Esta ferramenta transforma fotografías en obras de arte dixital, empregando estilos de artistas famosos como Van Gogh ou Picasso.
Firefly: Plataforma desenvolvida por Adobe, ten un plan gratuíto de 25 créditos mensuais. Non só crea imaxes, tamén pode procesalas.
Ideogram: Accesible con unha conta de Google. Ten un plan gratuíto de 10 créditos/día.
Krea.ai: Plataforma que da acceso a diversas ferramentas de creación de imaxes (Flux, Enhancer, Realtime) e de vídeo.
Let's Enhance: Xenera imaxes e mellora a calidade de imaxes de baixa resolución, aumentando a nitidez e resolución. Ofrece plan gratuíto con 10 créditos.
AI Image Upscaler: Permite aumentar a resolución e mellorar a calidade das imaxes. Na versión gratuíta ofrece 20 créditos.
Actualización (febreiro 2025):
Qwen: Asistente de IA multifuncional deseñado para proporcionar respostas rápidas e precisas. Pode xerar imaxes a partir de texto (prompt).
Napkin.ai: Ferramenta de xeración de imaxes especializada na creación rápida de bosquexos, deseños e diagramas a partir de descricións textuais. Ideal para crear ilustracións conceptuais. Ofrece unha versión gratuíta con funcionalidades básicas e un límite diario de xeracións.
Continuamos a traballar con modelos preentrenados, pero esta vez utilizaremos as habilidades de recoñecemento de imaxes.
Nesta práctica imos a utilizar outra páxina (similar á MLfK), Learning ML (LML) para realizar un proxecto de recoñecemento de imaxes.
Unha vez na páxina inicial, accederemos á opción “LearningML Basic” e veremos un entorno similar ao que xa utilizamos en Machine Learning for Kids, neste caso non teremos que rexistrarnos pero, en contrapartida, deberemos gardar o modelo no noso ordenador para podelo utilizar en futuras sesións.
No vídeo anterior se fai referencia a 2 páxinas web, que permiten comprender máis profundamente como funciona a extracción de características nunha imaxe:
A demostración interactiva de DeepLizard (explica como se aplican filtros para detectar bordos en imaxes).
A ferramenta de Adam Harley (permite debuxar un número e comprobar se o sistema de intelixencia artificial o recoñece correctamente).
Tamén podedes ver o seguinte vídeo sobre a aplicación dos sistemas de recoñecemento de imaxes para traducir a linguaxe de signos en tempo real:
Ao longo deste curso utilizaremos diversos tipos de ferramentas que usan IA, nesta entrada comezamos co análise e uso dos Chatbots, grandes modelos de linguaxe.
Utilizaremos diversos Chatbots para a realización dunha tarefa concreta, crear unha entrada no noso blogue onde realizaremos unha análise de diversos Chatbots gratuítos e accesibles na Web, realizando unha comparativa entre eles e indicando cales foron os puntos fortes e débiles de cada un deles.
ChatGPT (OpenAI): Modelo de linguaxe avanzado que ofrece interaccións conversacionais de alta calidade, ideal para a creación de contido e asistencia en tarefas complexas.
Gemini (Google): É un asistente virtual, integrado no ecosistema de Google, que combina potencia de busca e capacidades de diálogo, permitindo interaccións naturais e informativas.
Perplexity AI: A súa capacidade de buscar información actualizada a partir de diversas fontes o converte na opción ideal para investigacións rápidas, con indicacións de datos de contexto (fontes, etc).
Copilot (Microsoft): Asistente baseado en IA que se integra en aplicacións de Microsoft.
Claude (Anthropic): Claude é un chatbot deseñado para ser intuitivo e seguro, priorizando a ética e a responsabilidade nas súas interaccións.
YouChat (You.com): YouChat está integrado na plataforma de busca You.com, útil para aqueles que unha busca interactiva e personalizada.
Actualización (febreiro 2025):
DeepSeek: Modelo avanzado que combina capacidades de busca profunda con interaccións de diálogo naturais, ideal para tarefas de investigación exhaustiva.
Qwen (Alibabá): Asistente de IA multifuncional deseñado para proporcionar respostas rápidas e precisas, así como para axudar na xestión de tarefas e no acceso á información.
De seguido tedes un vídeo da canle Dot.csv que explica que son os LLM:
¿Qué es un LLM? Enormes Modelos del Lenguaje | Large Language Models
Por último, tedes aquí a ligazón a outro vídeo da canle Dot.csv na que explica o estado actual (principios de 2024) dos LLM como ChatGPT:
Lo que OpenAI NO quería que supieras sobre GPT4 - (De los MoEs a Mixtral)
Para a realización desta práctica imos acceder á aplicación en liña Machine Learning for Kids (MLfK).
Esta ferramenta vainos permitir adestrar unha IA e consta de 3 módulos:
• “Entrenar” (onde engadimos os exemplos de adestramento).
• “Aprender&Probar” (onde se adestra ao modelo).
• “Crea” (xera o código que poderemos exportar a Scratch ou Python).
Crearemos un “detector de sentimentos” que sexa capaz de determinar se estamos felices, tristes ou cansos en función dos nosos comentarios por escrito, posteriormente exportaremos o código e engadiremos esta función a un programa de Scratch creado por nós.
Desde esta entrada do blogue imos a acceder ao contido interactivo de DIXIT,Deep Learning. UX1A recoñece emocións, no que poderás interactuar cunha IA real adestrada con Deep Learning para que recoñeza as cinco emocións: alegría, sorpresa, tristura, enfado e medo.
O Axente intelixente conta cun conxunto de tarxetas precargadas (emoticonas, pictogramas e ilustracións de UX1A) que se mostran de forma aleatoria. Ademais, permite a experimentación libre realizando tantas probas como se desexe.
Se o teu ordenador conta con unha cámara web, tamén poderás probar se detecta as túas emocións.
De seguido podes acceder ao contido complementario ao anteior (tamén un contido interactivo de DIXIT): Retos_UX1A recoñece emocións, no que atoparás tres retos diferentes que te axudarán a reflexionar e obter conclusións sobre as túas interaccións co axente intelixente UX1A.
Desde esta entrada do blogue imos a acceder ao contido interactivo de DIXIT, Deep Learning UX1A aprende, que simula o adestramento dunha máquina con Deep Learning (Aprendizaxe Profunda) para que identifique a emoción de alegría.
Nesta simulación, podrás adestrar a UX1A con tres conxuntos diferentes de datos e debes analizar os resultados obtidos con cada un deles.
Esta actividade permitiránnos comprender tanto o proceso de adestramento e aprendizaxe dunha máquina (recoñecemento de trazos nunha mostra) como a importancia da calidade dos datos empregados no seu adestramento.
Preme na imaxe ou na seguinte ligazón "Respóndelle a UX1A" (contido obtido do Repositorio de Contidos Educativos da Xunta de Galicia), para acceder a un vídeo onde as expertas Verónica Bolón, Sara Guerreiro e Minia Manteiga, responden a diversas cuestións sobre a Intelixencia Artificial. Deberás responder correctamente ás preguntas propostas para seguir avanzando no vídeo.
Se posteriormente queres acceder ao vídeo da entrevista (sen as preguntas), preme na seguinte ligazón: "As entrevistas de UX1A".
Podes tamén acceder as 3 entrevistas individuais (nunha versión extendida), nas seguintes ligazóns: