Solucionado (ver solução)

Importante

Você está vendo a versão anterior da nova experiência da Alura que estamos preparando para você. Em breve, ela ganha uma identidade visual novinha totalmente pensada em potencializar seus estudos!

Solucionado
(ver solução)
8
respostas

[Dúvida] Desenvolvimento com IA, vagas e mercado de trabalho.

Olá, recentemente vi o vídeo com o Fabrício no you tube: https://www.youtube.com/watch?v=pEPg7_j5Zcg&t=34s sobre como RODAR LLMs Open Source no seu PC sem pagar APIs e recentemente acompanhei uma seletiva para vagas na qual os candidatos deveriam fazer aplicações em 24 horas e enviar no processo seletivo. Com o uso da IA na confecção de códigos as empresas estão diminuindo o prazo para a realização das ''atividades'' seletivas. No vídeo não ficou claro para mim como um desenvolvedor poderia utilizar a AI para construir códigos.
Quanto de RAM seria o mínimo para isso? Quais IAs usam para ter melhor desempenho para fazer sistemas (e sempre usam LM studio?), quantos bilhões (parâmetros) são bons para escolher para um bom desenvolvimento? O que vocês usam para fazer um projeto fullstack? Tem algum curso ou trilha na Alura que ensina essas coisas? Queria saber sobre opções gratuitas de IA, porque agora também estamos concorrendo com a velocidade para se realizar coisas e conseguir uma vaga ou destaque. :/

8 respostas
solução!

Olá, Sheila. Como vai?

Sua dúvida é extremamente atual e toca em um ponto crucial do mercado de trabalho de tecnologia. O uso de IAs generativas mudou o ritmo do desenvolvimento de software e as empresas, sabendo disso, passaram a ajustar suas expectativas de velocidade e produtividade nos processos seletivos. Não se sinta desanimada; em vez de uma barreira, encare essas ferramentas como suas copilotas para acelerar o seu próprio aprendizado e entrega.

Para sanar as suas dúvidas de forma bem prática e direta, vamos dividir os aspectos de hardware, ferramentas e como as IAs são usadas para criar um projeto do zero:

1. Quanto de RAM é necessário e quantos parâmetros escolher?

Quando falamos em rodar modelos locais (no seu próprio PC) usando ferramentas como o LM Studio ou Ollama, o principal limitador não é apenas a memória RAM do computador, mas sim a VRAM (memória dedicada da sua placa de vídeo).

  • Mínimo recomendado: 16 GB de RAM no computador. Com isso, você consegue rodar modelos menores e leves.
  • Tamanho dos modelos (Parâmetros): Para desenvolvimento de código em máquinas convencionais, os modelos de 7 Bilhões (7B) ou 8 Bilhões (8B) de parâmetros são o equilíbrio perfeito entre velocidade e inteligência. Modelos menores que isso (como 1B ou 3B) costumam errar muito a sintaxe do código.
  • Exemplos de modelos locais focados em código: O Llama 3 (8B) da Meta, o CodeLlama (7B) ou o DeepSeek-Coder (7B). Eles rodam muito bem no LM Studio.

2. Como um desenvolvedor usa a IA na prática para construir sistemas?

No dia a dia, os desenvolvedores raramente ficam copiando e colando texto do navegador para o editor de código. Nós integramos a IA diretamente na nossa IDE (como o VS Code) através de extensões. O fluxo funciona através de três pilares:

  • Decomposição do problema: Você não pede "faça um sistema de vendas". Você pede: "Crie uma função em TypeScript que valide se o e-mail do usuário possui o caractere '@'".
  • Autocompletar (Inline Completion): Enquanto você digita o nome de uma função, a IA prevê o que você quer fazer e sugere o resto do código cinzento. Você só aperta Tab para aceitar.
  • Explicação e Refatoração: Você pode selecionar um código que não está entendendo ou que está dando erro, abrir o chat da extensão e pedir: "/explain" (explique este código) ou "/fix" (corrija o bug).

3. Opções Gratuitas e Ferramentas para Projetos Fullstack

Se você quer velocidade para competir no mercado sem gastar com APIs, as melhores opções atuais são uma mistura de ferramentas em nuvem (com planos gratuitos robustos) e extensões de IDE:

  • Para codificar na IDE (Alternativas gratuitas ao GitHub Copilot):

  • Codeium: Uma extensão excelente e gratuita para o VS Code que oferece autocompletar e chat inteligente sem cobrar nada.

  • Tabnine: Possui um plano gratuito muito bom focado em IA local e autocompletar.

  • Continue.dev: Uma extensão de código aberto para o VS Code que permite que você conecte o seu LM Studio local diretamente dentro do seu editor de código. Toda vez que você pede um código, ele usa a IA que está rodando no seu próprio PC.

  • Para arquitetura e lógica (Web): O ChatGPT (versão gratuita) ou o Claude (da Anthropic) são excelentes para ajudar a planejar o banco de dados e a estrutura de um projeto Fullstack.

4. O que se usa em um projeto Fullstack moderno acelerado por IA?

Para montar um projeto Fullstack rápido para um desafio de 24 horas, a stack mais popular e que possui maior suporte das IAs por ter muito material na internet é:

  • Front-end: React (com Vite) ou Next.js utilizando componentes prontos do Tailwind CSS ou Shadcn/ui (a IA cria layouts lindos e rápidos usando Tailwind).
  • Back-end: Node.js (com Express ou NestJS) ou Python (com FastAPI).
  • Banco de Dados: PostgreSQL ou MongoDB.

5. Trilhas e Cursos na Alura para você

A Alura possui conteúdos específicos para te colocar na liderança desse mercado.

  • Formação Inteligência Artificial Aplicada ao Desenvolvimento de Software: Uma trilha completa que ensina como utilizar ferramentas de IA para aumentar sua produtividade, criar testes automatizados e refatorar códigos.
  • Cursos de GitHub Copilot e OpenAI API: Mesmo focando nas opções gratuitas, entender como o Copilot funciona vai te dar a base de como interagir com o Codeium ou com o seu LM Studio local através de Engenharia de Prompt para código.
  • Escola de Inteligência Artificial da Alura: Explore os cursos introdutórios de LLMs para entender os conceitos de parâmetros, quantização (que permite rodar modelos pesados em PCs mais fracos) e contexts.

Dominar essas ferramentas vai te devolver o fator "velocidade" que os processos seletivos estão exigindo, permitindo que você foque na parte estratégica do software enquanto a IA digita a parte repetitiva.

Espero que possa ter lhe ajudado!

Olá, obrigada pela resposta! E quanto de VRAM é exigida para essas especificações (modelos de 7 a 8 milhões de parâmetros)? Tem alguma forma de IA local integrada a IDE que você goste mais?

Olá, Sheila. Como vai?

Um detalhe importante para começarmos é notar que os modelos que conversamos anteriormente possuem de 7 a 8 bilhões de parâmetros (geralmente descritos como 7B ou 8B), e não milhões. Essa diferença de escala é justamente o que dá a eles a capacidade de entender lógica de programação complexa.

Sobre a sua dúvida sobre a memória da placa de vídeo (VRAM), a quantidade necessária depende diretamente de uma técnica chamada quantização. A quantização é um processo que compacta o peso do modelo para que ele ocupe menos espaço de memória sem perder muita inteligência.

Para rodar um modelo de 7B ou 8B quantizado em 4 bits (geralmente o padrão mais recomendado no formato GGUF), os requisitos de VRAM são os seguintes:

  • Mínimo de VRAM: Cerca de 5 GB a 6 GB dedicados. Uma placa de vídeo com 6 GB de VRAM já consegue carregar a maior parte do modelo.

  • Recomendado: Uma placa de vídeo com 8 GB de VRAM ou mais (como as placas da linha Nvidia RTX 3060 ou 4060). Com 8 GB, o modelo roda inteiramente na GPU, o que deixa as respostas extremamente rápidas.

Se a sua placa de vídeo tiver menos VRAM que isso, ferramentas como o LM Studio ou o Ollama fazem uma divisão inteligente: eles colocam uma parte do modelo na VRAM e o restante na memória RAM normal do computador. O modelo ainda vai funcionar perfeitamente, mas a velocidade de geração do código vai ser um pouco menor.
Em relação à integração local com a IDE, a ferramenta que eu mais gosto e recomendo é a extensão Continue.dev para o VS Code.

O grande trunfo do Continue.dev é que ele é um projeto totalmente de código aberto e funciona como uma ponte perfeita. Você instala a extensão no seu editor de código e aponta a configuração dela para o endereço local do seu LM Studio ou Ollama.

A experiência de uso fica excelente por conta de dois recursos práticos no dia a dia:

  • Chat e comandos na barra lateral: Você pode selecionar qualquer trecho do seu arquivo de código, abrir o chat da extensão e pedir para o seu modelo local explicar a lógica, encontrar bugs ou gerar testes unitários.

  • Autocomplete em tempo real: Você pode configurar um modelo local menor e mais veloz (como o DeepSeek-Coder-1.3B) apenas para o preenchimento de código cinzento enquanto você digita, o que economiza muita memória e mantém a agilidade.

Configurar essa dupla (LM Studio ou Ollama rodando em segundo plano e a extensão Continue.dev integrada na IDE) vai te dar um ambiente de desenvolvimento robusto, totalmente gratuito e focado em produtividade para os seus testes técnicos.

Espero que possa ter lhe ajudado!

Olá! Muito obrigada pela reposta! E você sabe se LM Studio ou Ollama precisam fucionar dentro de containeres para não afetar outras funções do computador? Ela poderia ser usada tanto no windons quanto no linux no mesmo computador via WSL?

Olá, Sheila. Como vai?

Sua pergunta é excelente, pois a organização do ambiente de desenvolvimento é fundamental quando começamos a rodar inteligência artificial localmente.

Sobre a necessidade de usar contêineres:
A resposta curta é não. Nem o LM Studio e nem o Ollama precisam rodar dentro de contêineres (como o Docker) para proteger as outras funções do seu computador. Na verdade, é altamente recomendado que você os instale diretamente no seu sistema operacional nativo.

  • Acesso à Placa de Vídeo (GPU): Ferramentas de IA dependem muito da sua placa de vídeo para gerar código rapidamente. Instalar esses programas nativamente garante que eles tenham acesso direto e irrestrito à sua VRAM, entregando o máximo de desempenho. Configurar o acesso à GPU dentro de um contêiner pode ser um processo bastante complexo e sujeito a lentidão.

  • Impacto no Sistema: Eles funcionam como aplicativos comuns. O LM Studio, por exemplo, abre como um programa qualquer de desktop. Eles só vão consumir muita memória e processamento no momento exato em que estiverem "pensando" e gerando uma resposta. Quando você fecha o aplicativo, os recursos do seu computador são imediatamente liberados e tudo volta ao normal.

Sobre o uso integrado entre Windows e Linux via WSL:
Sim, isso é perfeitamente possível e, de fato, é o cenário preferido por muitos desenvolvedores! Você não precisa instalar a IA duas vezes. O fluxo de trabalho mais eficiente funciona da seguinte forma:

  • Instale o LM Studio ou o Ollama nativamente no seu Windows.

  • Inicie o modelo e ative o servidor local da ferramenta no Windows (o LM Studio geralmente usa a porta 1234 e o Ollama a porta 11434).

  • Abra o seu projeto de código no Linux via WSL usando o seu VS Code.

  • Como o WSL e o Windows compartilham a mesma rede localhost, as extensões rodando dentro do seu VS Code no Linux (como o Continue.dev) conseguem se comunicar perfeitamente com a IA que está rodando no Windows.

Para fazer isso funcionar na extensão, você geralmente só precisa apontar o endereço da API para a sua máquina local, utilizando um código de configuração simples, como este:

http://localhost:1234

Dessa forma, você une o melhor dos dois mundos: mantém o seu ambiente de programação limpo e organizado dentro do Linux (WSL), enquanto aproveita toda a facilidade de configuração e o poder da sua placa de vídeo gerenciados diretamente pelo Windows.

Espero que possa ter lhe ajudado!

Obrigada Evandro!

Olá, eu tive mais uma dúvida, rs!

Para rodar uma IA local com as especificações que você mostrou, será que um processador INTEL CORE i5 12400 LGA 1700 está ok? Tem alguma restrição de potência ou barramentos para placas mãe? (minha placa mãe é H610M H GIGABYTE LGA 1700).

Eu pesquisei e teoricamente não teria problema mas eu quis perguntar a alguém...

Olá, Sheila. Como vai?

Que bom que você continuou pesquisando! Pode perguntar à vontade, o fórum serve exatamente para isso.

Sim, a sua pesquisa está certíssima! O processador Intel Core i5 12400 e a placa-mãe Gigabyte H610M H formam uma ótima base e não trarão problemas para o seu objetivo de rodar IAs locais.

Para deixar mais claro como esses componentes interagem com a IA, vamos dividir a sua dúvida em duas partes:

1. O papel do Processador (Core i5 12400)
Quando rodamos modelos de linguagem (LLMs) localmente, o "trabalho pesado" de raciocínio e geração de texto/código é feito pela Placa de Vídeo (GPU). O papel do seu processador nesse momento é preparar os dados, enviar as tarefas para a GPU e lidar com a parte do modelo que, por acaso, precise usar a memória RAM comum. O i5 12400 possui 6 núcleos e 12 threads, o que o torna um processador muito competente e rápido. Ele vai dar conta de orquestrar a inteligência artificial tranquilamente, sem causar gargalos.

2. Barramentos e Placa-mãe (H610M H)
Sobre restrições de barramento: não se preocupe. A sua placa-mãe possui um slot PCI Express 4.0 x16, que é o encaixe onde a placa de vídeo vai conectada. A versão 4.0 desse barramento oferece uma velocidade de transferência de dados excelente. Mesmo sendo uma placa-mãe de entrada, esse barramento é largo o suficiente para não limitar o desempenho de placas de vídeo modernas (como uma RTX 3060 ou 4060, que costumam ter os 8 GB de VRAM recomendados).

Ponto de atenção extra: A Fonte de Alimentação
Como você mencionou a palavra potência, vale um aviso importante: a placa-mãe em si não impõe restrições de potência que afetem o processamento da IA, mas o seu computador como um todo precisará de energia suficiente.
Como a Placa de Vídeo vai trabalhar em capacidade máxima nos segundos em que a IA estiver gerando o código, certifique-se de que o seu computador possui uma boa fonte de alimentação (geralmente uma fonte de qualidade entre 550W a 650W é suficiente para esse nível de hardware). Isso evita que o computador desligue sozinho por falta de energia durante o uso do modelo.

Em resumo, a base do seu computador atual está super aprovada para esse projeto. Se você combiná-la com os 16 GB de RAM e uma boa placa de vídeo, terá uma excelente máquina de desenvolvimento acelerada por IA.

Espero que possa ter lhe ajudado!