Date: prev next · Thread: first prev next last
2011 Archives by date, by thread · List index


Le 17/04/2011 09:56, Jean-Baptiste Faure a écrit :
Le 17/04/2011 00:01, Laurent BALLAND-POIRIER a écrit :
Je suis heureux que tu lances le sujet car c'est une de mes issues
favorites (issue 34093), avec la régression polynomiale (issue 20819).
Pour moi ce sont deux demandes d'ordres différents.
Certes. Mais à partir du moment où on se décidera d'en résoudre une, l'autre résolution suivra.
Les données peuvent ne pas passer exactement par zéro (ou une autre
valeur constituant un offset) alors que physiquement le phénomène doit
passer par l'origine. Par exemple si le nombre de données est faible, il
est peu probable que cela passe exactement par zéro.
Ok, mais dans ce cas la vraie question à se poser est : pourquoi ça ne
passe pas par zéro alors que ça devrait ?
Mais parce que dans la vraie vie il y a forcément des incertitudes de mesure.
Pas de torturer les données pour leur faire dire ce qu'on a décidé
qu'elles devaient dire.
Il ne s'agit pas de "torturer". Est-ce que la relation linéaire trouvée (y=ax+b) a plus de sens que la relation proportionnelle (y=mx) ?
Imposer à une droite de passer par l'origine c'est ajouter des données
extérieures aux données expérimentales en leur donnant un poids bien
plus important que les autres. Et si ce sont des données valides
pourquoi ne pas les ajouter au jeu de données utilisé pour calculer la
régression linéaire ?
Je ne suis pas d'accord : le résultat numérique n'est pas le même.
L'exemple donné dans la question sur la ML développeurs
(http://nabble.documentfoundation.org/needful-function-on-calc-tp2824180p2824180.html)
est le suivant :
distance parcourue par une voiture en fonction de sa vitesse :
1 m/s : 5 m
2 m/s : 11 m
Si on ajoute (0,0) au jeu de données la relation n'est pas linéaire.
Pourquoi la forcer ?
Et pourquoi pas ? Si l'utilisateur a envie ? Il a le droit de choisir le couleur de la police dans laquelle il va écrire l'équation (il peut même choisir en blanc sur fond blanc) et il ne pourrait pas choisir son équation ? De toute façon, l'utilisateur peut forcer l'ordonnée à l'origine à 0 avec la fonction DROITEREG. Donc pourquoi lui interdire de faire la même chose avec la courbe de tendance ? S'il veut une autre valeur, c'est encore possible, juste un peu plus sioux.
Pour moi ce n'est pas une démarche scientifique.
Parce qu'une relation linéaire est une démarche scientifique ? Il ne s'agit que d'une équation plus ou moins arbitraire. Je ne comprends pas pourquoi cela gêne davantage d'écrire y=mx plutôt que y=mx+b. Qu'est-ce qui justifie qu'une relation à 2 paramètres ait plus de sens qu'une relation à 1 paramètre ou 3 ? La raison pour moi remonte à l'origine de StarOffice où un nombre limité de types de régression a été défini, sans paramètre supplémentaire, et que l'on n'a pas voulu y toucher par la suite. Pendant longtemps d'ailleurs l'icône de la régression puissance correspondait à une régression polynomiale (c'est dire si cette zone était poussiéreuse)
http://openoffice.org/bugzilla/show_bug.cgi?id=96629
Certes les courbes de tendance ont évolué avec Chart2 (OOo 2.3) avec enfin une équation accessible (je n'ai toujours pas compris l'intérêt de tracer une régression si on ne récupère pas son équation). Mais maintenant, pour faire évoluer les courbes de tendance, il faut définir des paramètres supplémentaires, et donc les enregistrer dans le fichier ce qui complique les choses quand cela n'a pas été prévu au départ.
Mais bon il est vrai
que nous sommes habitués à voir des régressions linéaires tracées pour
tout et n'importe quoi.
Pour ma part, j'ai besoin de relation du type y=mx (loi de Henry)
http://fr.wikipedia.org/wiki/Loi_de_Henry
Alors si mes points expérimentaux ne passent pas exactement par 0, c'est peut être que mon capteur est mal étalonné, ma solution mal titrée ou simplement que je n'ai pas assez de chiffres significatifs. Bref, j'ai de l'incertitude sur mes mesures, mais de la certitude sur la relation à trouver. Dans la vraie vie, les valeurs numériques ne s'arrêtent à deux chiffres après la virgule, comme voulait nous le faire croire Calc jusqu'à la version 3.3, ou comme le rêvent les financiers.
En attendant, je rappelle que MS-Excel supporte une telle fonctionnalité
depuis le siècle dernier (1993 avec MS-Excel 5.0), de même que Gnumeric
(version 1.6), pour les tests que j'ai pu faire.
Est-ce une bonne et suffisante raison pour faire pareil ?
C'est en tout cas une attente des utilisateurs... qui dure !
D'un autre coté on peut bien ajouter toutes les formes d'ajustement que
l'on veut. Le problème est alors d'être bien clair sur ce que le
logiciel fait. Et dans le cas présent ce n'est plus une régression
linéaire. Il faut trouver un autre nom pour ne pas induire en erreur.
Si tu forces l'ordonnée à l'origine à 0, il s'agit d'une régression proportionnelle. Si tu forces à une autre valeur, il s'agit toujours d'une régression linéaire.
Je te laisse le soin de répondre en ce sens à la question sur la liste
dév ? Tu le feras sans doute plus gentiment que moi ;-)
Merci pour le lien. Je n'avais pas été fichu de trouver le fil dont tu parlais ;-) J'espère que cela pourra être un nouveau départ pour cette problématique qui me tient à cœur. Pourtant, je reste réaliste quant à l'importance de ces fonctionnalités pour une suite bureautique généraliste. Lorsque j'ai pris mon bâton de pèlerin sur les différents forums francophones et anglophones pour trouver des témoignages de personnes ayant des besoins concrets dans ce domaine, afin d'illustrer la demande de changement de format auprès d'OASIS, j'ai essuyé un grand silence respectueux.

Bon je vais aller boire ma tisane pour me calmer.

Bon dimanche au soleil !

Laurent BP

--
Envoyez un mail à discuss+help@fr.libreoffice.org pour savoir comment vous désinscrire
Les archives de la liste sont disponibles à http://listarchives.libreoffice.org/fr/discuss/
Tous les messages envoyés sur cette liste seront archivés publiquement et ne pourront pas être 
supprimés

Context


Privacy Policy | Impressum (Legal Info) | Copyright information: Unless otherwise specified, all text and images on this website are licensed under the Creative Commons Attribution-Share Alike 3.0 License. This does not include the source code of LibreOffice, which is licensed under the Mozilla Public License (MPLv2). "LibreOffice" and "The Document Foundation" are registered trademarks of their corresponding registered owners or are in actual use as trademarks in one or more countries. Their respective logos and icons are also subject to international copyright laws. Use thereof is explained in our trademark policy.