Problemilla "Físico" - El dilema del prisionero

Iniciado por Dors-seldon, 02 de Septiembre de 2009, 04:02:10 PM

Tema anterior - Siguiente tema

0 Usuarios y 1 Visitante están viendo este tema.

Dors-seldon

   No se si os estoy sobrevalorando al exponeros este problema :P . Pero me parecéis, por lo que os he podido leer, además de grandes conocedores de música, reproductores, auriculares, etc, buenas cabezas pensantes. Los que os voy a contar tiene que ver con programación (que no estoy segura si he leído por aquí algo, aparte de sistemas operativos como linux que en general necesitan un cierto conocimiento de ordenadores), pero aunque este no sea el caso creo que podeis ayudarme igual.

   En una asignatura de mi carrera, optativa, llamada Física No lineal, para aprobar tenemos que hacer un trabajo sobre algo de lo que hayamos visto en estas clases, que en general son cosas bastante interesantes en el plano divulgativo. Una compañera y yo elegimos un tema dentro de sociología que comenzaba con "El dilema del prisionero". No os voy a pedir que me hagáis el trabajo, solo a ver si con lo que se os ocurra me dan ideas más o menos novedosas.

   La idea inicial del trabajo, "El dilema del prisionero" consiste en lo siguiente:
Dos supuestos delincuentes son arrestados. Son cogidos por separado y se les propone a los dos lo mismo: Si delatas a tu compañero, sales libre de la carcel y él se queda 10 años, si no lo delatas y él si, te quedas 10 años, si los dos os delatáis os quedareis 6 años. Pero si ninguno de los dos se traiciona se quedan solo un año cada uno (por falta de pruebas).
Lo menos arriesgado es delatar,  para asegurarte no quedarte 10 años en la carcel, incluso puedes tener posibilidad de salir directamente. ¿Cuanto confías en tu compañero?

   Ahora bien, este juego se complica, y lo he complicado de la siguiente manera (ya tengo mi programita hecho que lo simula casi a la perfeción  :mrgreen: ):

   Ahora no hablamos de solo dos jugadores, ni de una sola ronda, ni siquiera de una sola generación de jugadores. Y ahora en vez de años de delito son beneficios que puedes ganar.

  - Existe una población de u habitantes y entre ellos hay relaciones, puede cooperar o fallar. Por un lado esta población en cada generación pueden interactuar o todos contra todos (el 1 con el 2, 3, 4, hasta u, y asi sucesivamente y con cada uno unas N rondas maximas) o elegir parejas al azar e interaccionar entre ellas N. (además se me había ocurrido ponerlas a todos en una red y cada uno interactuar con un cierto numero de vecinos).

  - Esas rondas de cada pareja significa hacer lo que en el juego simple pero N veces guardándoles cada vez su beneficio. Pero si alguno de los dos o los dos falla al otro en alguna de la ronda se termina el juego. Esto es, como hemos visto, no cooperar es lo que te da más beneficio si el otro si lo hace (por ejemplo, sales libre directamente de la carcel), ahora bien, si lo haces dejas de jugar las siguientes rondas (lo más lógico es que si sabes el numero de rondas máximas cooperes N-1 veces)
.
  - ¿Pero para que sirve ese beneficio?
Imaginemos que es una población que evoluciona, tienen descendencia, pero solo aquellos que han tenido más beneficio son los que tienen más probabilidades de reproducirse. Y su estrategia es pasada a sus hijos (si a mi padre la ido bien, yo sigo "pa'lante" con la misma que me irá bien).

  - Si esto siguiera así, hasta una cierta generación, al final acabarían siendo una población no cooperativa. Y vemos que esto no es del todo así en la sociedad. Así que hay que poner otro punto más, la mutación, una probabilidad de que la estrategia del padre sea distinta que la del hijo. Si el padre cooperaba n veces, el hijo tiene una probabilidad de 1-2X de cooperar n veces y X de cooperar n-1 o n+1 veces, lo que significa esto, para que nos entendamos, es que a mayor X mayor probabilidad hay de que muten, y esto se ve que implica que se tiende a una mayor cooperación.

Un resumen de conceptos:

Población: numero de jugadores
Forma de interactuar: Por pares, todos contra todos o parejas de dos aleatorias.
Numero de rondas: El numero de juegos que tiene cada pareja, dependiendo de su estrategia y del numero máximo de rondas.
Beneficios: Sería algo así: Si los dos cooperan ganan 3, Si los dos fallan 1, si coopera y el otro falla 0, si fallas y el otro coopera 5.
Mutación: Para cambiar la estrategia de una generación a otra.

   Las preguntas un poco abstractas respecto al tema sin tantos tecnicismos y a lo que podría responder el programa, podrían ser:

¿En una sociedad de cooperantes un cabroncete podría destrozar la sociedad? ¿Y al revés? ¿depende del lugar en el que se encuentre? ¿Qué sociedad sería más próspera?

Se que antes se me ocurrían más, pero como he tenido que ir a lo concreto para poder programarlo las ideas abstractas se me han ido. Pero aunque podais darme soluciones abstractas, si podeis afinar más sería incluso más interesante  ;-) .

No se si me he pasado con este problema de "mates", pero bueno, creí que es un tema interesante por lo menos de una forma divulgativa y si alguien sabe más del tema, pues mejor que mejor.
"Un sutil pensamiento erróneo puede dar lugar a una indagación fructífera que revela verdades de gran valor."

Mi blog ----> http://dors-seldon.blogspot.com/

Auriculares: AKG k551, KZ KS6, phonak 022, AKG 601, JVC HA-FX750
Reproductores: Cowon J3 8gb, Clip+ 2gb+8gb, Sony NWZ-S639, Sony NW-A35
Otros aparatos: Kindle paperwhite Galaxy s20+

blogoblo

#1
Cita de: Dors-seldon en 02 de Septiembre de 2009, 04:02:10 PM
¿En una sociedad de cooperantes un cabroncete podría destrozar la sociedad? ¿Y al revés? ¿depende del lugar en el que se encuentre? ¿Qué sociedad sería más próspera?

Lo ideal, lo mejor para la sociedad es colaborar. Pero la realidad es que no todo el mundo entiende esa filosofía y, entonces, sólo algunos se benefician.

Yo hice un juego parecido, pero con sumas y restas (si colaboras = 1; si no colaboras = resta 3 a todos, etc) y el que gana es el que siempre se niega a colaborar. Pero eso que es bueno para uno mismo (porque gana mucho), no lo es para el conjunto así que, al final, es malo para todos o no tan bueno como si todos colaboran y todos sacan tajada.

Cita de: Dors-seldon en 02 de Septiembre de 2009, 04:02:10 PM
   No se si os estoy sobrevalorando al exponeros este problema :P .

¿Soy listo?  :mrgreen:  :mrgreen:  :mrgreen:  :mrgreen:


griji

Eso blogoblo, pasa en todos los sitios y etapas de la vida. Por ejemplo, en los trabajos siempre va a haber el/los escaqueados que les endosaran el trabajo a los currantes, el típico que se arroncha de pagar para que otro pague o simplemente el buen amigo que siempre lo tendrás ahí para lo que necesites y el que no aún así teniéndote él a tí. Y siempre que lo comentes con alguién te dirán el mismo dicho ( no seas de su condición ). Yo creo que en la vida hay que encontrar un equilibrio entre ser buena persona pero no llegar a ser el tonto del pueblo.
Reproductores: Md nf 810, rh 910, md rh1, Iaudio m5, Cowon D2, Creative zen v plus, Iriver clix2
Auriculares: Sennheiser cx 300, sony ex 85

obarriel

#3
¿La población es constante? o ¿sólo puede crecer?

Podrías añadir una varieble "esperanza de vida" que al igual que la descendencia dependiera en parte de los beneficios (algo así como que se matan entre ellos por no cooperar). Así la población total seria otra variable.

El sistema de mutación que pones no entiendo muy bien cómo funciona.
Reproductores:  Sonys: X1060,S205F, S639, S545, E465, A846, HD5, HD3 y HD1, Philips HDD1830, Samsung YH-820, Olympus m:robe 500, Sansa Clip Zip, Iriver B100, MPMan F10
Auriculares: Westone UM3x
No uses mp para lo que se puede preguntar en el foro.

Nadescap

Gracias por liarme la cabeza en época de exámenes :evil:
Reproductores: Meizu SP 4gb, Cowon S9 16gb, Sansa Clip 8gb, iPad 16gb
Auriculares: Panasonic RP-HJE 200, Sennheiser CX300, Koss PortaPro, Westone 3      
Amplificador: FiiO E5
Anteriores: Sansa Fuze, Cowon D2, Jays d-jays, Ultimate Ears Super.Fi 5, Audio-Technica ATH-ES7, Westone UM1, S-Jays, C-Jays, Beta Brainwavz, Corda Headsix

La respuesta a muchas de tus preguntas del foro esta AQUI

blogoblo

Cita de: griji en 02 de Septiembre de 2009, 04:42:20 PM
Eso blogoblo, pasa en todos los sitios y etapas de la vida.

Claro, claro. La realidad es así.

Pero el juego lo entiendo como una forma de poner en evidencia el egoismo como la forma de conseguir éxitos uno mismo, aprovechándose en cierta forma de la buena voluntad del resto. Y éso trae consigo un perjuicio para el conjunto al no repartirse 'beneficios'.

Cita de: griji en 02 de Septiembre de 2009, 04:42:20 PM
Yo creo que en la vida hay que encontrar un equilibrio entre ser buena persona pero no llegar a ser el tonto del pueblo.

Evidentemente es así. Pero si te conviertes en el tonto del pueblo es porque otro ha sido el listillo del pueblo. Si todos van a una, todos ganan; si hay dispersión, ganarán sólo unos pocos... los listillos.

Colaborar es el ideal. No colaborar es la realidad. Somos muy egoistas.


tigretones

#6
Cita de: Dors-seldon en 02 de Septiembre de 2009, 04:02:10 PM
Pero si ninguno de los dos se traiciona se quedan solo un año cada uno (por falta de pruebas).
8-O 8-O 8-O 8-O 8-O

¿Como no hay pruebas te encarcelan sólo un año? Pero, ¿qué clase de justicia es esa? 


:risa:
Reproductores: iPod nano 1ªg 4Gb (rockboxed) - Cowon D2 8 Gb - iPod nano 6ªg 8Gb.
Auriculares: Sennheiser CX300-II - SoundMagic PL30 (R.I.P) - SoundMagic PL50 (R.I.P)

Dors-seldon

Varias aclaraciones:
- La primera frase de mi primer comentario no pretendía insultar, sino todo lo contrario, para decir que os tengo en muy alto nivel intelectual. También puede que tenga un toque humorístico "Esto puede que sea demasiado para vosotros", pero en realidad quiero decir "si no lo sabeis no significa que seais tontos" :bajo: :P

- Blogoblo, creo que lo estás planteando de una manera que no buscaba, creo que ese es un pensamiento filosófico de cómo te gustaría que fueran las cosas(o como crees que seria mejor), pero en lo que yo estaba pensando más es en intentar asemejarlo a la realidad, y la realidad siempre es mucho más compleja que un programa, pero cuantas más variables posibles les metas más se parecerá. Pero realmente la sociedad que simula mi programa tiene cierta tendencia a la colaboración, puesto que la ronda termina si fallas. Si fallas en la primera ronda solo ganarias 5 puntos, mientras que si colaboras n-1 rondas ganarias 3*n + 5.

- Obarriel, mi programa tiene ambas posibilidades, aunque cuando solo crece, aún me da algunos problemas, sobretodo porque no se cómo hacer las elecciones del numero de hijos, beneficios,etc. Pero con la población estable salen los datos esperados.
Cada vez que se pasa a una generacion, la anterior "muere" y solo se quedan los hijos, por lo que "la esperanza de vida" se puede definir como "Esperanza de descendencia" que es lo que hace mi programa.
El sistema de mutación.... ¿En cuanto al epsilon o lo que significa?

- Nadescap, de nada, para eso estamos  :lol: ... Yo además de hacer este programa tengo que ponerme a estudiar Óptica, y es lo más aburrido del mundo! Odio la óptica!  :cry:
"Un sutil pensamiento erróneo puede dar lugar a una indagación fructífera que revela verdades de gran valor."

Mi blog ----> http://dors-seldon.blogspot.com/

Auriculares: AKG k551, KZ KS6, phonak 022, AKG 601, JVC HA-FX750
Reproductores: Cowon J3 8gb, Clip+ 2gb+8gb, Sony NWZ-S639, Sony NW-A35
Otros aparatos: Kindle paperwhite Galaxy s20+

Benedetti

#8
Si es que en este foro se lee de todo :risa:

A ver, el Problema del Prisionero es un problema clásico de Teoría de Juegos (*1).  A día de hoy podemos decir que está ya muy ensayado y prácticamente ligado a la historia de la programación lineal en los ordenadores. La solución concreta del problema dependerá en cada caso de la matriz de pagos que se asigne (qué gana o pierde el prisionero en cada una de las distintas situaciones), del número de iteraciones y en casos avanzados de las 'metareglas' con que se juegue el juego, a efectos por ejemplo de eliminar la recursividad en las respuestas. Y no os digo la solución porque pensar es saludable :mrgreen:

Lo que sí os digo es que el problema tiene una larga trayectoria en biología (es decir, en un escenario en el que el beneficio se traduce en descendencia). El primero creo que fue el libro de J. Maynard Smith: "Evolution and the Theory of Games", seguido posteriormente por R. Axelrod y W.D. Hamilton (no, el de la puzolana no, el biólogo :risa:). Un buen resumen del planteamiento, las posibles soluciones así como la divertida historia de la simulación informática del Problema del Prisionero puede encontrarse en "El Gen egoísta", de R. Dawkins (*3), libro conocidísimo, francamente recomendable y fácil de conseguir tanto en edición digital como el papel.

Cita de: obarriel en 02 de Septiembre de 2009, 05:32:16 PM
¿La población es constante? o ¿sólo puede crecer?

Podrías añadir una varieble "esperanza de vida" que al igual que la descendencia dependiera en parte de los beneficios (algo así como que se matan entre ellos por no cooperar). Así la población total seria otra variable.

El sistema de mutación que pones no entiendo muy bien cómo funciona.

Tal y como lo ha explicado Dors, el pago por la victoria no se obtiene en dinero sino en descendencia, es decir, las victorias aseguran la permanencia en el juego (*4). De paso añado una complicación suplementaria al juego: puesto que la eficacia de una estrategia depende de su conocimiento por parte de los jugadores, es perfectamente posible que la eficacia de una estrategia esté determinada por la proporción de los que la suscriben, es decir, que la victoria estaría determinada por una determinada proporción social entre dos o más estrategias.

Hala, a pensar :mrgreen:

---------------------------------------------------------------------------------------------------------------
(*1) Eso que inventó John Nash (*2)
(*2) El científico loco de "Una Mente Maravillosa", no el arquitecto. Los arquitectos, como la mayor parte de los profesionales, no piensan a no ser que les pagues. Matemáticos y filósofos son la excepción.
(*3) Tema XII, Dors. Más claro el agua (si te da perrera leer mándame un privado y te paso algunos resúmenes).
(*4) Como las partidas en una máquina tragaperras, por ejemplo. Si se juega bien se gana seguir jugando.

Reproductores: Cowon D2 8 GB // Cowon O2 32 Gb + SDHC 16 GB.
Auriculares: Head-Direct RE0 // Ultimate Ears Triple.Fi 10.

Dors-seldon

Cita de: tigretones en 02 de Septiembre de 2009, 06:15:08 PM
Cita de: Dors-seldon en 02 de Septiembre de 2009, 04:02:10 PM
Pero si ninguno de los dos se traiciona se quedan solo un año cada uno (por falta de pruebas).
8-O 8-O 8-O 8-O 8-O

¿Como no hay pruebas, te encarcelan sólo un año? Pero, ¿qué clase de justicia es esa? 


:risa:

Diremos que no había suficientes pruebas jeje

Ah! Blogoblo, mi contestación anterior fue escrita sin tu contestación posterior.
Pero para pensar lo que tu estas haciendo tiene que ser desde fuera, y aquí, lo único que podemos ver con "perspectiva maquina" lo bueno que seria para cada persona, porque además si analizamos lo que es mejor para el conjunto, es demasiado evidente y se acabaría muy rápido... La sociedad es un conjunto discreto de personas pensantes...
"Un sutil pensamiento erróneo puede dar lugar a una indagación fructífera que revela verdades de gran valor."

Mi blog ----> http://dors-seldon.blogspot.com/

Auriculares: AKG k551, KZ KS6, phonak 022, AKG 601, JVC HA-FX750
Reproductores: Cowon J3 8gb, Clip+ 2gb+8gb, Sony NWZ-S639, Sony NW-A35
Otros aparatos: Kindle paperwhite Galaxy s20+

blogoblo

#10
Cita de: Dors-seldon en 02 de Septiembre de 2009, 06:16:51 PM
Varias aclaraciones:
- La primera frase de mi primer comentario no pretendía insultar, sino todo lo contrario, para decir que os tengo en muy alto nivel intelectual. También puede que tenga un toque humorístico "Esto puede que sea demasiado para vosotros", pero en realidad quiero decir "si no lo sabeis no significa que seais tontos" :bajo: :P


Cita de: Benedetti en 02 de Septiembre de 2009, 06:17:59 PM
Tal y como lo ha explicado Dors, el pago por la victoria no se obtiene en dinero sino en descendencia, es decir, las victorias aseguran la permanencia en el juego (*4). De paso añado una complicación suplementaria al juego: puesto que la eficacia de una estrategia depende de su conocimiento por parte de los jugadores, es perfectamente posible que la eficacia de una estrategia esté determinada por la proporción de los que la suscriben, es decir, que la victoria estaría determinada por una determinada proporción social entre dos o más estrategias.

Hala, a pensar :mrgreen:

Definitivamente, estoy en el grupo de los tontos.  :mrgreen: Como decía el gran Rubianes sobre una neurona: "no fuerces, no fuerces".   :banana2:

¡Que no son horas!  ;-)

Cita de: Dors-seldon en 02 de Septiembre de 2009, 06:21:07 PM
La sociedad es un conjunto discreto de personas pensantes...

Y 'sintientes'...

Benedetti

Bueno, Blogobló, la definición de ignorante en el Diccionario del Diablo de Ambrose Bierce es "el que ignora algo que tu sabes, y sabe algo que tu ignoras" :mrgreen:
Por cierto, quién es Rubianes? :roll:
Reproductores: Cowon D2 8 GB // Cowon O2 32 Gb + SDHC 16 GB.
Auriculares: Head-Direct RE0 // Ultimate Ears Triple.Fi 10.

blogoblo

Cita de: Benedetti en 02 de Septiembre de 2009, 06:36:32 PM
Por cierto, quién es Rubianes? :roll:

Un humorista galaico-catalán que nos dejó hace unos meses. ;-)