NUMBEO

Motivation et Méthodologie

Avant la création de Numbeo (en avril 2009), aucune autre base de données gratuite n'existait sur le coût de la vie (avec des données structurées et des indices).

D'autres rapports sur le coût de la vie avaient des données cachées ou coûteuses à l'achat.      Leur recherche était très limitée dans le nombre de villes incluses. Il était difficile de grandir sans une augmentation significative des dépenses, car ils reposaient sur des données collectées manuellement.      Aussi, il n'y avait aucune information sur le taux d'erreur dans leurs données collectées manuellement.      La collecte manuelle des données sur le coût de la vie est sujette à erreur:

Les rapports disponibles avant l'année 2009 comprennent généralement juste un index, ce qui n'est pas suffisant pour une estimation personnelle puisqu'une personne n'est pas une moyenne personne en raison de différents styles de vie tels que:

Les autres sources de coût de la vie disponibles ne fournissaient pas un moyen systématique d'extraire des indices personnalisés. Numbeo fournit un logiciel de classe mondiale pour extraire gratuitement divers indicateurs économiques (comme en utilisant notre outil "Panier de biens et services").

Avant la Grande Récession (Crise économique mondiale de 2007-2009), le prix des propriétés dans le monde entier avait tendance à sembler fou pour le fondateur de ce site. Le prix d'un petit appartement dans un pays du tiers monde où il vit actuellement était le même que 310 écrans TFT ultra modernes à ce moment-là. La spéculation sauvage des prix de l'immobilier suggérait que les gens avaient vraiment besoin d'un outil pour spéculer ou pour baisser leur spéculation.

Voilà comment Numbeo est né. Numbeo:

 

Methodologie

Collecte et traitement des données

Pour collecter des données, Numbeo s'appuie sur les contributions des utilisateurs et des données collectées manuellement à partir de sources autorisées (sites web de supermarchés, sites web d'entreprises de taxis, institutions gouvernementales, articles de journaux, autres enquêtes, etc.). Les données collectées manuellement à partir de sources établies sont entrées deux fois par an.

Nous réalisons des filtres automatiques et semi-automatiques pour filtrer les interférences de données. Le filtre le plus simple fonctionne comme suit: si, pour un prix donné dans une ville, les valeurs sont 5, 6, 20 et 4 dans une période de temps récente, la valeur 20 est rejetée comme un bruit (car sa valeur est plus de 4 fois que la valeur moyenne)

Un autre filtre rejette ¼ (un quart) des entrées les plus basses et les plus élevées étant donné que les cas limites ont une probabilité plus élevée d'être incorrects. Parmi les entrées restantes, les valeurs les plus basses, les plus élevées et les moyennes sont calculées et affichées.

Il y a des filtres plus sophistiqués en cours d'utilisation. Les filtres fonctionnent mieux lorsqu'il y a plus d'entrées.

L'un des filtres avancés tente d'éliminer les mauvaises données d'apprentissage. Il essaye de trouver les données rejetées (données de spam) et s'il remarque des irrégularités, il les ramène dans le calcul.

Pour résumer nos filtres, Numbeo utilise la technologie heuristique pour obtenir des données de qualité. En utilisant les données existantes, Numbeo rejette périodiquement les données qui sont probablement statistiquement incorrectes.

Numbeo archive également les valeurs des anciennes données (notre politique de dépréciation des données par défaut est de 12 mois, bien que nous utilisions des données jusqu'à 18 mois lorsque nous ne disposons pas de nouvelles données et que les indicateurs suggèrent une inflation faible dans un pays donné). Les valeurs des anciennes données sont conservées pour être utilisées à des fins historiques.

Agrégation des données pour un pays

Pour agréger les données d'un pays, nous utilisons toutes les entrées (de toutes les villes) pour calculer les données sur la moyenne du pays. Notez qu'elles sont différentes des données calculées agrégées pour toutes les villes de ce pays (pour lesquelles nous avons des données dans la base de données). En raison des formules sous-jacentes utilisées (rejeter 25% des données hautes et basses avant de calculer les valeurs d'affichage), le prix parfois bas et élevé d'un article dans une ville peut sembler inférieur aux valeurs basses et hautes de ce pays. Cette anomalie apparaît en raison des formules sous-jacentes utilisées. Ainsi, dans les calculs pour le pays, nous pondérons une ville par le nombre de contributeurs. Puisqu'il y a un plus grand nombre de données pour un pays que pour une ville, les données montrées au niveau d'un pays, en général, contiennent moins d'interférences que les données montrées au niveau d'une ville.

Devises

Nous utilisons des flux à plusieurs devises, y compris le flux de la Banque centrale européenne, pour mettre à jour nos taux de change internes presque toutes les heures. Pour chaque entrée des contributeurs, nous enregistrons dans notre base de données la valeur en EUR, USD et devise de l'entrée (en utilisant le taux de change actuel). Lors du calcul des moyennes, nous réutilisons l'une de ces entrées en fonction de la stabilité de la devise et de la devise prédominante dans le pays pour essayer de minimiser les erreurs de comparaison de devises croisées.

Pour afficher les données historiques, nous utilisons les taux de change historiques mensuels pour calculer les données (taux de change de la monnaie au milieu du mois). Si les utilisateurs finaux choisissent une devise d'affichage personnalisée pour afficher les données historiques au cours d'une année, le taux de change de la monnaie de milieu d'année est utilisé pour calculer les données affichées.

Taxes

Nos données sur les prix doivent inclure la TPS et la TVA. Nos données salariales moyennes doivent contenir la valeur après impôts. Nous pouvons donc utiliser ces données directement pour estimer le pouvoir d'achat local.

Calcul d'indices

L'indice du Coût de la Vie est basé sur notre meilleure estimation des dépenses moyennes dans une ville donnée pour une famille de quatre personnes. Les coefficients peuvent changer au fil du temps. Mais puisque la méthodologie n'est pas cachée, au moment de l'écriture ces coefficients sont les suivants:
    
mysql> select name, category, cpi_factor as cost_of_living_factor, rent_factor from item where cpi_factor > 0 or rent_factor > 0 order by category, relative_id;
+-----------------------------------------------------------------+---------------------+-----------------------+-------------+
| name                                                            | category            | cost_of_living_factor | rent_factor |
+-----------------------------------------------------------------+---------------------+-----------------------+-------------+
| 1 Pair of Jeans (Levis 501 Or Similar)                          | Clothing And Shoes  |                  0.35 |           0 |
| 1 Summer Dress in a Chain Store (Zara, H&M, ...)                | Clothing And Shoes  |                  0.35 |           0 |
| 1 Pair of Nike Running Shoes (Mid-Range)                        | Clothing And Shoes  |                  0.35 |           0 |
| 1 Pair of Men Leather Business Shoes                            | Clothing And Shoes  |                  0.35 |           0 |
| Milk (regular), (1 liter)                                       | Markets             |                    25 |           0 |
| Loaf of Fresh White Bread (500g)                                | Markets             |                    31 |           0 |
| Rice (white), (1kg)                                             | Markets             |                    14 |           0 |
| Eggs (12)                                                       | Markets             |                    20 |           0 |
| Local Cheese (1kg)                                              | Markets             |                    12 |           0 |
| Chicken Breasts (Boneless, Skinless), (1kg)                     | Markets             |                    15 |           0 |
| Beef Round (1kg) (or Equivalent Back Leg Red Meat)              | Markets             |                    15 |           0 |
| Apples (1kg)                                                    | Markets             |                    31 |           0 |
| Banana (1kg)                                                    | Markets             |                    25 |           0 |
| Oranges (1kg)                                                   | Markets             |                    30 |           0 |
| Tomato (1kg)                                                    | Markets             |                    22 |           0 |
| Potato (1kg)                                                    | Markets             |                    24 |           0 |
| Onion (1kg)                                                     | Markets             |                    10 |           0 |
| Lettuce (1 head)                                                | Markets             |                    18 |           0 |
| Water (1.5 liter bottle)                                        | Markets             |                    30 |           0 |
| Bottle of Wine (Mid-Range)                                      | Markets             |                     4 |           0 |
| Domestic Beer (0.5 liter bottle)                                | Markets             |                     6 |           0 |
| Imported Beer (0.33 liter bottle)                               | Markets             |                     6 |           0 |
| Cigarettes 20 Pack (Marlboro)                                   | Markets             |                    15 |           0 |
| Apartment (1 bedroom) in City Centre                            | Rent Per Month      |                     0 |        0.25 |
| Apartment (1 bedroom) Outside of Centre                         | Rent Per Month      |                     0 |        0.25 |
| Apartment (3 bedrooms) in City Centre                           | Rent Per Month      |                     0 |        0.25 |
| Apartment (3 bedrooms) Outside of Centre                        | Rent Per Month      |                     0 |        0.25 |
| Meal, Inexpensive Restaurant                                    | Restaurants         |                    16 |           0 |
| Meal for 2 People, Mid-range Restaurant, Three-course           | Restaurants         |                   3.5 |           0 |
| McMeal at McDonalds (or Equivalent Combo Meal)                  | Restaurants         |                     6 |           0 |
| Domestic Beer (0.5 liter draught)                               | Restaurants         |                     5 |           0 |
| Imported Beer (0.33 liter bottle)                               | Restaurants         |                     5 |           0 |
| Cappuccino (regular)                                            | Restaurants         |                    15 |           0 |
| Coke/Pepsi (0.33 liter bottle)                                  | Restaurants         |                     6 |           0 |
| Water (0.33 liter bottle)                                       | Restaurants         |                     6 |           0 |
| Fitness Club, Monthly Fee for 1 Adult                           | Sports And Leisure  |                   2.3 |           0 |
| Tennis Court Rent (1 Hour on Weekend)                           | Sports And Leisure  |                     3 |           0 |
| Cinema, International Release, 1 Seat                           | Sports And Leisure  |                     6 |           0 |
| One-way Ticket (Local Transport)                                | Transportation      |                    20 |           0 |
| Monthly Pass (Regular Price)                                    | Transportation      |                   1.5 |           0 |
| Taxi Start (Normal Tariff)                                      | Transportation      |                     5 |           0 |
| Taxi 1km (Normal Tariff)                                        | Transportation      |                    20 |           0 |
| Taxi 1hour Waiting (Normal Tariff)                              | Transportation      |                   0.7 |           0 |
| Gasoline (1 liter)                                              | Transportation      |                    60 |           0 |
| Volkswagen Golf 1.4 90 KW Trendline (Or Equivalent New Car)     | Transportation      |                0.0035 |           0 |
| Toyota Corolla 1.6l 97kW Comfort (Or Equivalent New Car)        | Transportation      |                0.0035 |           0 |
| Basic (Electricity, Heating, Water, Garbage) for 85m2 Apartment | Utilities (Monthly) |                     1 |           0 |
| 1 min. of Prepaid Mobile Tariff Local (No Discounts or Plans)   | Utilities (Monthly) |                   320 |           0 |
| Internet (10 Mbps, Unlimited Data, Cable/ADSL)                  | Utilities (Monthly) |                     1 |           0 |
+-----------------------------------------------------------------+---------------------+-----------------------+-------------+
      Local_Puchasing_Power_Index = (Average_Disposable_Salary(This_City) / BasketConsumerPlusRent(This_City)) / (Average_Disposable_Salary(New_York) / BasketConsumerPlusRent(New_York))
      
      BasketConsumerPlusRent(City) = sum_of (Price_in_the_city * (cost_of_living_factor + rent_factor))
    

Politique d'Archivage des Données

La section sur le Coût de la Vie utilise les données saisies au cours des 12 derniers mois (dans un cas particulier, lorsque le nombre d'entrées dans une ville est très faible et que les indicateurs suggèrent que l'inflation est faible dans un pays, nous utilisons des données jusqu'à 18 mois parce que nous pensons que ces données pourraient ne pas avoir changé si personne n'a édité les données existantes). Les autres sections qui utilisent le même ensemble de données utilisent la même politique d'archivage des données.

Notez que certaines autres sections du site utilisent des politiques d'archivage de données différentes. Chaque mois, les anciennes données sont déplacées vers les archives et peuvent être extraites avec notre API.

Politique Cartographique

Notre politique cartographique consiste à dépeindre le monde de facto; c'est-à-dire représenter la réalité actuelle au mieux de notre jugement. Nos partenaires pourraient avoir une politique cartographique différente qui pourrait être reflétée dans les logiciels de notre site web.

 

Cette page a été traduite de l'anglais. Improve translation of this page