Airbnb em Lisboa: análise de preços e tendências com Ciência de Dados

Introdução

Nos últimos anos, o Airbnb transformou a forma como viajamos e nos hospedamos. Lisboa, uma das capitais mais visitadas da Europa, possui milhares de acomodações listadas na plataforma. Mas o que os dados podem nos contar sobre esse mercado?

Neste artigo, apresento uma análise exploratória baseada em dados reais do Airbnb, revelando padrões de preços, tipos de imóveis, disponibilidade e até insights para quem deseja investir ou anunciar na cidade.

Objetivos da Análise

– Explorar a distribuição dos preços das diárias.
– Comparar os tipos de acomodações e seus valores médios.
– Identificar os bairros mais relevantes em termos de oferta e disponibilidade.
– Avaliar quais fatores têm maior impacto no preço.
– Testar a possibilidade de **prever preços com base em características dos imóveis**.

Metodologia e Ferramentas

Para este estudo utilizei um conjunto de dados público disponível no Kaggle.

📌 Principais ferramentas utilizadas:

– Python
– Pandas / NumPy (manipulação de dados)
– Matplotlib / Seaborn / Plotly (visualizações)
– Scikit-learn (modelagem preditiva)
– Folium (mapas interativos)
– Streamlit (dashboard interativo)

📌 Principais Descobertas

– 💰 Distribuição de Preços: a grande maioria das diárias está abaixo de €1500, com alguns outliers representando imóveis de luxo.

– 🏠 Tipos de Acomodações: apartamentos inteiros têm preços médios bem mais altos que quartos privados ou compartilhados.
– 📍 Oferta por Bairro: alguns bairros concentram muito mais imóveis, indicando regiões de alta procura e competitividade.
– 🔍 Correlação Entre Variáveis: tipo de imóvel e localização se destacam como fatores mais relevantes para explicar o preço.
– 🤖 Modelo Preditivo (Regressão Linear): apresentou resultados modestos, mas demonstrou potencial para uso de machine learning no setor imobiliário.

🤖 Modelos Preditivos Avançados

Evoluímos a análise inicial para algoritmos mais robustos:

– Árvore de Decisão (DecisionTreeRegressor)
– Random Forest (RandomForestRegressor)

📊 Resultados (comparados com a Regressão Linear):

– Random Forest apresentou melhor desempenho em R² e RMSE, conseguindo capturar variações complexas de preço.
– Isso mostra que técnicas de machine learning têm grande potencial no setor imobiliário para previsão de valores.

🗺️ Mapas Interativos

Visualizamos a distribuição espacial das acomodações em Lisboa com Folium

– Mapa de Pontos: cada imóvel aparece como um marcador colorido conforme a faixa de preço.
– Mapa de Calor: identifica regiões com maior concentração de imóveis e preços.

👉 Cl ique aqui para explorar o mapa interativo

📊 Dashboard Interativo

Para transformar a análise em um produto explorável, criei um **dashboard em Streamlit**:

– Filtros por bairro, tipo de acomodação e faixa de preço
– Histograma interativo da distribuição de preços
– Boxplot comparando tipos de acomodação
– Mapa interativo atualizado conforme os filtros

👉 Acesse o Dashboard Interativo

Conclusões

Lisboa apresenta um mercado de hospedagens dinâmico, com grande variação de preços e forte impacto do tipo de acomodação na precificação. Os dados evidenciam tendências que podem apoiar tanto turistas quanto investidores.

Além disso, a aplicação de algoritmos como Random Forest e visualizações interativas traz uma camada de inteligência ao estudo, aproximando a análise de um cenário real de apoio à decisão.

Próximos Passos

– Testar algoritmos mais avançados como **XGBoost** ou **LightGBM**.
– Integrar dados de turismo (ex.: fluxo de visitantes) para análises preditivas mais ricas.
– Publicar o dashboard em nuvem (Streamlit Cloud ou Hugging Face Spaces).

✍️ **Autor:** Lisandro Almeida Viana
📌 Este projeto faz parte do meu portfólio em Ciência de Dados. Conecte-se comigo no LinkedIn para acompanhar próximos estudos!