Date: prev next · Thread: first prev next last
2011 Archives by date, by thread · List index


Bonjour,

Exceptionnellement je réponds au début ...

Je suis d'accord avec Laurent pour laisser à l'utilisateur la responsabilité
des opérations qu'il réalise.
Ce qui me parait CAPITAL, c'est l'information donnée à l'utilisateur:
 - Utiliser les définitions correctes
 - Dire quel est le traitement fait, en faire la description mathématique,
afin que chacun puisse facilement le reproduire et vérifier que l'outil fait
bien le traitement attendu.
L'aide de LibO donne me semble-t-il des informations assez détaillées, mais
je n'ai pas eu l'occasion d'y regarder de très près.

Quant à ce problème de "régression linéaire" forcée à passer par l'origine,
le principe n'est pas choquant, la méthode des moindres carrés s'applique
pour comparer toute fonction à une série de données, et on a bien le droit
de comparer la fonction y = mx avec le jeu de données plutôt que y = mx + b
si on estime cette première forme plus pertinente d'un point de vue physique
(après tout la régression linéaire fait aussi une hypothèse tout aussi
arbitraire qu'il faut aussi interroger).

Il reste que le terme de régression linéaire me semble "réservé" à une
droite quelconque y = mx + b, il faut donc rechercher la bonne terminologie
pour y = mx

Bonne journée,

Michel

-----Message d'origine-----
De : Jean-Baptiste Faure [mailto:jbf.faure@orange.fr]
Envoyé : dimanche 17 avril 2011 09:56
À : discuss@fr.libreoffice.org
Objet : Re: [fr-discuss] régression linéaire avec contrainte de passer par
l'origine

Le 17/04/2011 00:01, Laurent BALLAND-POIRIER a écrit :
Bonsoir Jean-Baptiste,

Le 16/04/2011 22:04, Jean-Baptiste Faure a écrit :
Bonjour,

J'aimerais avoir votre sentiment quant à une demande classique que j'ai
retrouvé tout à l'heure sur la liste développeurs.
Il s'agit de pouvoir ajouter sur un graphique une courbe de tendance
linéaire avec la contrainte de passer par (0,0).

Pour moi il ne s'agit plus de régression linéaire : si les données ne
passent par zéro, il n'y a pas de raison de forcer la régression
linéaire à le faire. De plus cela peut masquer le fait que choisir un
ajustement linéaire est simplement erroné parce que les données ne sont
simplement pas alignées.

Je suis heureux que tu lances le sujet car c'est une de mes issues
favorites (issue 34093), avec la régression polynomiale (issue 20819).

Pour moi ce sont deux demandes d'ordres différents.

Les données peuvent ne pas passer exactement par zéro (ou une autre
valeur constituant un offset) alors que physiquement le phénomène doit
passer par l'origine. Par exemple si le nombre de données est faible, il
est peu probable que cela passe exactement par zéro.

Ok, mais dans ce cas la vraie question à se poser est : pourquoi ça ne
passe pas par zéro alors que ça devrait ?
Pas de torturer les données pour leur faire dire ce qu'on a décidé
qu'elles devaient dire.

Quant à "masquer" un comportement erroné, c'est quand même l'utilisateur
qui choisit ou non de forcer l'ordonnée à l'origine. Merci de lui
accorder l'intelligence minimum de faire le choix qui lui convient en
fonction de ses besoins.
L'utilisateur a déjà le choix parmi plusieurs régressions, il est donc
quand même sensé savoir un minimum ce qu'il veut. Pourquoi alors ne pas
supprimer les autres choix de peur qu'il se trompe ?

Le problème n'est pas tout à fait le même : choisir entre une régression
linéaire ou une en loi puissance c'est choisir la forme de la loi
d'ajustement.
Imposer à une droite de passer par l'origine c'est ajouter des données
extérieures aux données expérimentales en leur donnant un poids bien
plus important que les autres. Et si ce sont des données valides
pourquoi ne pas les ajouter au jeu de données utilisé pour calculer la
régression linéaire ?

L'exemple donné dans la question sur la ML développeurs
(http://nabble.documentfoundation.org/needful-function-on-calc-
tp2824180p2824180.html)
est le suivant :
distance parcourue par une voiture en fonction de sa vitesse :
1 m/s : 5 m
2 m/s : 11 m
Si on ajoute (0,0) au jeu de données la relation n'est pas linéaire.
Pourquoi la forcer ?
Pour moi ce n'est pas une démarche scientifique. Mais bon il est vrai
que nous sommes habitués à voir des régressions linéaires tracées pour
tout et n'importe quoi.


En attendant, je rappelle que MS-Excel supporte une telle fonctionnalité
depuis le siècle dernier (1993 avec MS-Excel 5.0), de même que Gnumeric
(version 1.6), pour les tests que j'ai pu faire.

Est-ce une bonne et suffisante raison pour faire pareil ?

D'un autre coté on peut bien ajouter toutes les formes d'ajustement que
l'on veut. Le problème est alors d'être bien clair sur ce que le
logiciel fait. Et dans le cas présent ce n'est plus une régression
linéaire. Il faut trouver un autre nom pour ne pas induire en erreur.

Le problème de développer une telle fonctionnalité est surtout lié
au format du fichier. Une demande de modification du format a été
déposée
auprès OASIS en décembre 2008, mais je n'ai pas vu de suite.

Mais si on a besoin de cette fonctionnalité et de la régression
polynomiale, il y a la superbe extension CorelPolyGUI de Marcin Gutman
http://extensions.services.openoffice.org/fr/project/CorelPolyGUI

Je te laisse le soin de répondre en ce sens à la question sur la liste
dév ? Tu le feras sans doute plus gentiment que moi ;-)

Bonne journée
JBF

--
Seuls des formats ouverts peuvent assurer la pérennité de vos documents.

--
Envoyez un mail à discuss+help@fr.libreoffice.org pour savoir comment vous
désinscrire
Les archives de la liste sont disponibles à
http://listarchives.libreoffice.org/fr/discuss/
Tous les messages envoyés sur cette liste seront archivés publiquement et
ne pourront pas être supprimés


-- 
Envoyez un mail à discuss+help@fr.libreoffice.org pour savoir comment vous désinscrire
Les archives de la liste sont disponibles à http://listarchives.libreoffice.org/fr/discuss/
Tous les messages envoyés sur cette liste seront archivés publiquement et ne pourront pas être 
supprimés

Context


Privacy Policy | Impressum (Legal Info) | Copyright information: Unless otherwise specified, all text and images on this website are licensed under the Creative Commons Attribution-Share Alike 3.0 License. This does not include the source code of LibreOffice, which is licensed under the Mozilla Public License (MPLv2). "LibreOffice" and "The Document Foundation" are registered trademarks of their corresponding registered owners or are in actual use as trademarks in one or more countries. Their respective logos and icons are also subject to international copyright laws. Use thereof is explained in our trademark policy.