Le 17/04/2011 09:56, Jean-Baptiste Faure a écrit :
Le 17/04/2011 00:01, Laurent BALLAND-POIRIER a écrit :
Je suis heureux que tu lances le sujet car c'est une de mes issues
favorites (issue 34093), avec la régression polynomiale (issue 20819).
Pour moi ce sont deux demandes d'ordres différents.
Certes. Mais à partir du moment où on se décidera d'en résoudre une,
l'autre résolution suivra.
Les données peuvent ne pas passer exactement par zéro (ou une autre
valeur constituant un offset) alors que physiquement le phénomène doit
passer par l'origine. Par exemple si le nombre de données est faible, il
est peu probable que cela passe exactement par zéro.
Ok, mais dans ce cas la vraie question à se poser est : pourquoi ça ne
passe pas par zéro alors que ça devrait ?
Mais parce que dans la vraie vie il y a forcément des incertitudes de
mesure.
Pas de torturer les données pour leur faire dire ce qu'on a décidé
qu'elles devaient dire.
Il ne s'agit pas de "torturer". Est-ce que la relation linéaire trouvée
(y=ax+b) a plus de sens que la relation proportionnelle (y=mx) ?
Imposer à une droite de passer par l'origine c'est ajouter des données
extérieures aux données expérimentales en leur donnant un poids bien
plus important que les autres. Et si ce sont des données valides
pourquoi ne pas les ajouter au jeu de données utilisé pour calculer la
régression linéaire ?
Je ne suis pas d'accord : le résultat numérique n'est pas le même.
L'exemple donné dans la question sur la ML développeurs
(http://nabble.documentfoundation.org/needful-function-on-calc-tp2824180p2824180.html)
est le suivant :
distance parcourue par une voiture en fonction de sa vitesse :
1 m/s : 5 m
2 m/s : 11 m
Si on ajoute (0,0) au jeu de données la relation n'est pas linéaire.
Pourquoi la forcer ?
Et pourquoi pas ? Si l'utilisateur a envie ? Il a le droit de choisir le
couleur de la police dans laquelle il va écrire l'équation (il peut même
choisir en blanc sur fond blanc) et il ne pourrait pas choisir son
équation ?
De toute façon, l'utilisateur peut forcer l'ordonnée à l'origine à 0
avec la fonction DROITEREG. Donc pourquoi lui interdire de faire la même
chose avec la courbe de tendance ? S'il veut une autre valeur, c'est
encore possible, juste un peu plus sioux.
Pour moi ce n'est pas une démarche scientifique.
Parce qu'une relation linéaire est une démarche scientifique ? Il ne
s'agit que d'une équation plus ou moins arbitraire. Je ne comprends pas
pourquoi cela gêne davantage d'écrire y=mx plutôt que y=mx+b. Qu'est-ce
qui justifie qu'une relation à 2 paramètres ait plus de sens qu'une
relation à 1 paramètre ou 3 ? La raison pour moi remonte à l'origine de
StarOffice où un nombre limité de types de régression a été défini, sans
paramètre supplémentaire, et que l'on n'a pas voulu y toucher par la
suite. Pendant longtemps d'ailleurs l'icône de la régression puissance
correspondait à une régression polynomiale (c'est dire si cette zone
était poussiéreuse)
http://openoffice.org/bugzilla/show_bug.cgi?id=96629
Certes les courbes de tendance ont évolué avec Chart2 (OOo 2.3) avec
enfin une équation accessible (je n'ai toujours pas compris l'intérêt de
tracer une régression si on ne récupère pas son équation).
Mais maintenant, pour faire évoluer les courbes de tendance, il faut
définir des paramètres supplémentaires, et donc les enregistrer dans le
fichier ce qui complique les choses quand cela n'a pas été prévu au départ.
Mais bon il est vrai
que nous sommes habitués à voir des régressions linéaires tracées pour
tout et n'importe quoi.
Pour ma part, j'ai besoin de relation du type y=mx (loi de Henry)
http://fr.wikipedia.org/wiki/Loi_de_Henry
Alors si mes points expérimentaux ne passent pas exactement par 0, c'est
peut être que mon capteur est mal étalonné, ma solution mal titrée ou
simplement que je n'ai pas assez de chiffres significatifs. Bref, j'ai
de l'incertitude sur mes mesures, mais de la certitude sur la relation à
trouver. Dans la vraie vie, les valeurs numériques ne s'arrêtent à deux
chiffres après la virgule, comme voulait nous le faire croire Calc
jusqu'à la version 3.3, ou comme le rêvent les financiers.
En attendant, je rappelle que MS-Excel supporte une telle fonctionnalité
depuis le siècle dernier (1993 avec MS-Excel 5.0), de même que Gnumeric
(version 1.6), pour les tests que j'ai pu faire.
Est-ce une bonne et suffisante raison pour faire pareil ?
C'est en tout cas une attente des utilisateurs... qui dure !
D'un autre coté on peut bien ajouter toutes les formes d'ajustement que
l'on veut. Le problème est alors d'être bien clair sur ce que le
logiciel fait. Et dans le cas présent ce n'est plus une régression
linéaire. Il faut trouver un autre nom pour ne pas induire en erreur.
Si tu forces l'ordonnée à l'origine à 0, il s'agit d'une régression
proportionnelle. Si tu forces à une autre valeur, il s'agit toujours
d'une régression linéaire.
Je te laisse le soin de répondre en ce sens à la question sur la liste
dév ? Tu le feras sans doute plus gentiment que moi ;-)
Merci pour le lien. Je n'avais pas été fichu de trouver le fil dont tu
parlais ;-) J'espère que cela pourra être un nouveau départ pour cette
problématique qui me tient à cœur. Pourtant, je reste réaliste quant à
l'importance de ces fonctionnalités pour une suite bureautique
généraliste. Lorsque j'ai pris mon bâton de pèlerin sur les différents
forums francophones et anglophones pour trouver des témoignages de
personnes ayant des besoins concrets dans ce domaine, afin d'illustrer
la demande de changement de format auprès d'OASIS, j'ai essuyé un grand
silence respectueux.
Bon je vais aller boire ma tisane pour me calmer.
Bon dimanche au soleil !
Laurent BP
--
Envoyez un mail à discuss+help@fr.libreoffice.org pour savoir comment vous désinscrire
Les archives de la liste sont disponibles à http://listarchives.libreoffice.org/fr/discuss/
Tous les messages envoyés sur cette liste seront archivés publiquement et ne pourront pas être
supprimés
Context
Privacy Policy |
Impressum (Legal Info) |
Copyright information: Unless otherwise specified, all text and images
on this website are licensed under the
Creative Commons Attribution-Share Alike 3.0 License.
This does not include the source code of LibreOffice, which is
licensed under the Mozilla Public License (
MPLv2).
"LibreOffice" and "The Document Foundation" are
registered trademarks of their corresponding registered owners or are
in actual use as trademarks in one or more countries. Their respective
logos and icons are also subject to international copyright laws. Use
thereof is explained in our
trademark policy.