mdh.sePublikasjoner
Endre søk
RefereraExporteraLink to record
Permanent link

Direct link
Referera
Referensformat
  • apa
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Annet format
Fler format
Språk
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Annet språk
Fler språk
Utmatningsformat
  • html
  • text
  • asciidoc
  • rtf
When to stop learning?: Bounding the stopping time in the PAC model
Mälardalens högskola, Institutionen för matematik och fysik.
2001 (svensk)Inngår i: Theory of Stochastic Processes, ISSN 0321-3900, Vol. 7, nr 23, s. 5-12Artikkel i tidsskrift (Fagfellevurdert) Published
sted, utgiver, år, opplag, sider
2001. Vol. 7, nr 23, s. 5-12
HSV kategori
Identifikatorer
URN: urn:nbn:se:mdh:diva-2976OAI: oai:DiVA.org:mdh-2976DiVA, id: diva2:115640
Tilgjengelig fra: 2008-03-08 Laget: 2008-03-08 Sist oppdatert: 2015-07-08bibliografisk kontrollert
Inngår i avhandling
1. On the optimal stopping time of learning
Åpne denne publikasjonen i ny fane eller vindu >>On the optimal stopping time of learning
2008 (engelsk)Licentiatavhandling, med artikler (Annet vitenskapelig)
Abstract [en]

 The goal of this thesis is to study the economics of computational learning. Attention is also paid to applications of computational learning models, especially Valiant's so-called `probably approximately correctly' (PAC) learning model, in econometric situations.

Specifically, an economically reasonable stopping time model of learning is the subject of two attached papers. In the rst paper, Paper A, the economics of PAC learning are considered. It is shown how a general form of the optimal stopping time bounds can be achieved using the PAC convergence rates for a `pessimistic-rational' learner in the most standard binary case of passive supervised PAC model of finite Vapnik-Chervonenkis (VC) dimension.

 

The second paper, Paper B, states precisely and improves the ideas introduced in Paper A and tests them in a specific and mathematically simple case. Using the maxmin procedure of Gilboa and Schmeidler the bounds for the stopping time are expressed in terms of the largest expected error of recall, and thus, effectively, in terms of the least expected reward. The problem of locating a real number θ by testing whether xi ≤ θ , with xi drawn from an calculated for a range of term rates, sample costs and rewards/penalties from a recall ae included. The standard econometric situations, such as product promotion, market research, credit risk assessment, and bargaining and tenders, where such bounds could be of interest, are pointed. 

These two papers are the essence of this thesis, and form it togheter with an introduction to the subject of learning.

Abstract [sv]

Målet med denna avhandling är att studera optimering av inlärning när det finns kostnader. Speciellt studerar jag Valiants så kallade PAC-inlärningsmodell  (Probably Approximately Correctly), ofta använd inom datavetenskap. I två artiklar behandlar jag hur länge, ur ekonomisk synvinkel, inlärningsperioden bör fortsätta.

I den första artikeln visar vi hur en generell form av begränsningar av den optimala inlärningsperioden kan fås med hjälp av PAC-konvergenshastigheten för en ’pessimistiskt rationell’ studerande (i det vanligaste binära fallet av passiv PAC-inlärningsmodell med ändlig VC-dimension).

I den andra artikeln fördjupar och förbättrar vi idéerna från den första artikeln, och testar dem i en specifik situation som är matematiskt enkel. Med hjälp av Gilboa – Schmeidlers max - minprocedur  uttrycker vi begränsningarna av den optimala inlärningsperioden som funktion av det största förväntade felet och därmed som funktion av den minsta förväntade belöningen. Vi diskuterar problemet med att hitta ett reellt tal θ genom testning av huruvida xi ≤ θ, där xi dras från en okänd fördelning. Här tar vi också upp exempel på begränsningar av inlärningsperioden, beräknade för en mängd av diskontovärden, stickprovskostnader och belöning/straff för erinran, samt en del vanliga ekonometriska situationer där sådana begränsningar är av intresse, såsom marknadsföring av produkter, marknadsanalys, kreditriskskattning och offertförhandling.

Avhandlingen består i huvuddel av dessa två artiklar samt en kort introduktion till ekonomiska, matematiska och datavetenskapliga inlärningsmodeller.

 

sted, utgiver, år, opplag, sider
Mälardalens högskola: Västerås, 2008. s. 28
Serie
Mälardalen University Press Licentiate Theses, ISSN 1651-9256 ; 96
Emneord
stopping time
HSV kategori
Identifikatorer
urn:nbn:se:mdh:diva-1531 (URN)978-91-86135-12-6 (ISBN)
Presentation
Gamma, Högskoleplan 1, Västerås (svensk)
Opponent
Veileder
Tilgjengelig fra: 2008-11-10 Laget: 2008-10-29 Sist oppdatert: 2008-11-17bibliografisk kontrollert

Open Access i DiVA

Fulltekst mangler i DiVA

Søk i DiVA

Av forfatter/redaktør
Bonner, RichardFedyszak-Koszela, A.
Av organisasjonen

Søk utenfor DiVA

GoogleGoogle Scholar

urn-nbn

Altmetric

urn-nbn
Totalt: 89 treff
RefereraExporteraLink to record
Permanent link

Direct link
Referera
Referensformat
  • apa
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Annet format
Fler format
Språk
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Annet språk
Fler språk
Utmatningsformat
  • html
  • text
  • asciidoc
  • rtf