mdh.sePublications
Change search
CiteExportLink to record
Permanent link

Direct link
Cite
Citation style
  • apa
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Other style
More styles
Language
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Other locale
More languages
Output format
  • html
  • text
  • asciidoc
  • rtf
Learning a real number, rationally
Mälardalen University, Department of Mathematics and Physics.
2007 (English)Report (Other academic)
Place, publisher, year, edition, pages
Department of Mathematics and Physics, Mälardalen University , 2007. , p. 32
Series
Research reports MDH/IMA ; 3
Keywords [en]
ambiguity, learning, multiple prior, stopping time, utility
National Category
Mathematics
Identifiers
URN: urn:nbn:se:mdh:diva-2972OAI: oai:DiVA.org:mdh-2972DiVA, id: diva2:115635
Available from: 2008-03-08 Created: 2008-03-08 Last updated: 2015-07-30Bibliographically approved
In thesis
1. On the optimal stopping time of learning
Open this publication in new window or tab >>On the optimal stopping time of learning
2008 (English)Licentiate thesis, comprehensive summary (Other scientific)
Abstract [en]

 The goal of this thesis is to study the economics of computational learning. Attention is also paid to applications of computational learning models, especially Valiant's so-called `probably approximately correctly' (PAC) learning model, in econometric situations.

Specifically, an economically reasonable stopping time model of learning is the subject of two attached papers. In the rst paper, Paper A, the economics of PAC learning are considered. It is shown how a general form of the optimal stopping time bounds can be achieved using the PAC convergence rates for a `pessimistic-rational' learner in the most standard binary case of passive supervised PAC model of finite Vapnik-Chervonenkis (VC) dimension.

 

The second paper, Paper B, states precisely and improves the ideas introduced in Paper A and tests them in a specific and mathematically simple case. Using the maxmin procedure of Gilboa and Schmeidler the bounds for the stopping time are expressed in terms of the largest expected error of recall, and thus, effectively, in terms of the least expected reward. The problem of locating a real number θ by testing whether xi ≤ θ , with xi drawn from an calculated for a range of term rates, sample costs and rewards/penalties from a recall ae included. The standard econometric situations, such as product promotion, market research, credit risk assessment, and bargaining and tenders, where such bounds could be of interest, are pointed. 

These two papers are the essence of this thesis, and form it togheter with an introduction to the subject of learning.

Abstract [sv]

Målet med denna avhandling är att studera optimering av inlärning när det finns kostnader. Speciellt studerar jag Valiants så kallade PAC-inlärningsmodell  (Probably Approximately Correctly), ofta använd inom datavetenskap. I två artiklar behandlar jag hur länge, ur ekonomisk synvinkel, inlärningsperioden bör fortsätta.

I den första artikeln visar vi hur en generell form av begränsningar av den optimala inlärningsperioden kan fås med hjälp av PAC-konvergenshastigheten för en ’pessimistiskt rationell’ studerande (i det vanligaste binära fallet av passiv PAC-inlärningsmodell med ändlig VC-dimension).

I den andra artikeln fördjupar och förbättrar vi idéerna från den första artikeln, och testar dem i en specifik situation som är matematiskt enkel. Med hjälp av Gilboa – Schmeidlers max - minprocedur  uttrycker vi begränsningarna av den optimala inlärningsperioden som funktion av det största förväntade felet och därmed som funktion av den minsta förväntade belöningen. Vi diskuterar problemet med att hitta ett reellt tal θ genom testning av huruvida xi ≤ θ, där xi dras från en okänd fördelning. Här tar vi också upp exempel på begränsningar av inlärningsperioden, beräknade för en mängd av diskontovärden, stickprovskostnader och belöning/straff för erinran, samt en del vanliga ekonometriska situationer där sådana begränsningar är av intresse, såsom marknadsföring av produkter, marknadsanalys, kreditriskskattning och offertförhandling.

Avhandlingen består i huvuddel av dessa två artiklar samt en kort introduktion till ekonomiska, matematiska och datavetenskapliga inlärningsmodeller.

 

Place, publisher, year, edition, pages
Mälardalens högskola: Västerås, 2008. p. 28
Series
Mälardalen University Press Licentiate Theses, ISSN 1651-9256 ; 96
Keywords
stopping time
National Category
Mathematics
Identifiers
urn:nbn:se:mdh:diva-1531 (URN)978-91-86135-12-6 (ISBN)
Presentation
Gamma, Högskoleplan 1, Västerås (Swedish)
Opponent
Supervisors
Available from: 2008-11-10 Created: 2008-10-29 Last updated: 2008-11-17Bibliographically approved

Open Access in DiVA

No full text in DiVA

Search in DiVA

By author/editor
Bonner, R.Fedyszak-Koszela, A.
By organisation
Department of Mathematics and Physics
Mathematics

Search outside of DiVA

GoogleGoogle Scholar

urn-nbn

Altmetric score

urn-nbn
Total: 82 hits
CiteExportLink to record
Permanent link

Direct link
Cite
Citation style
  • apa
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Other style
More styles
Language
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Other locale
More languages
Output format
  • html
  • text
  • asciidoc
  • rtf