Inteligencia Emocional
Inteligencia Emocional
Inteligencia Emocional
Guía y orientaciones
Introducción
Esta asignatura está básicamente enfocada a conocer los principales conceptos, pautas de
diseño , modelos y métodos para desarrollar sistemas con una buena escalabilidad, y la
evaluación de sistemas a escala Internet.
El material de referencia son una serie de artículos científicos seleccionados para cubrir
todos los ámbitos de la asignatura.
Estos artículos han sido publicados por editoriales de prestigio en revistas o conferencias
internacionales.
Por cada artículo hemos preparado un conjunto de preguntas orientadas a los aspectos y
conceptos más importantes.
Bloque 3. Sistemas P2P y volunteer computing: visión de los diferentes sistemas que
utilizan recursos no dedicados, aportados por los usuarios, como parte integral de su
arquitectura.
RD – Guía 1/24
REDES DISTRIBUIDAS (RD)
Guía y orientaciones
Contenidos
Bloque 1. Sistemas de Almacenamiento...............................................................3
Bloque 4. Networking....................................................................................17
Bloque 5. Miscelánea.....................................................................................22
RD – Guía 2/24
REDES DISTRIBUIDAS (RD)
Guía y orientaciones
En este primer bloque estudiaremos en más detalle algunos de los sistemas distribuidos de
almacenamiento de gran escala más relevantes. Estos sistemas están desarrollados por las
empresas más importantes del sector en la actualidad, como Google, Amazon, Yahoo, etc.
Distinguiremos dos tipos: los sistemas de archivos distribuidos [01,03] y las bases de datos NoSQL
[02,04].
[01a] Sanjay Ghemawat, Howard Gobioff, and Shun-Tak Leung. 2003. The Google file system.
SIGOPS Oper. Syst. Rev. 37, 5 (October 2003), 29-43.
[01b] Marshall Kirk McKusick and Sean Quinlan. 2009. GFS: Evolution on Fast-forward. Queue 7, 7,
Pages 10 (August 2009), 11 pages.
[02] Fay Chang, Jeffrey Dean, Sanjay Ghemawat, Wilson C. Hsieh, Deborah A. Wallach, Mike
Burrows, Tushar Chandra, Andrew Fikes, and Robert E. Gruber. 2008. Bigtable: A Distributed
Storage System for Structured Data. ACM Trans. Comput. Syst. 26, 2, Article 4 (June 2008), 26
pages.
[03] Konstantin Shvachko, Hairong Kuang, Sanjay Radia, and Robert Chansler. 2010. The Hadoop
Distributed File System. In Proceedings of the 2010 IEEE 26th Symposium on Mass Storage Systems
and Technologies (MSST) (MSST '10). IEEE Computer Society, Washington, DC, USA, 1-10.
[04] Giuseppe DeCandia, Deniz Hastorun, Madan Jampani, Gunavardhan Kakulapati, Avinash
Lakshman, Alex Pilchin, Swaminathan Sivasubramanian, Peter Vosshall, and Werner Vogels. 2007.
Dynamo: amazon's highly available key-value store. In Proceedings of twenty-first ACM SIGOPS
symposium on Operating systems principles (SOSP '07). ACM, New York, NY, USA, 205-220.
RD – Guía 3/24
REDES DISTRIBUIDAS (RD)
Guía y orientaciones
3. En relación a las asunciones de diseño, de qué manera mutan la mayoría de los archivos?
4. El clúster de GFS se divide en dos clases de nodos, comenta cuáles son y explica
brevemente su función.
5. Sabiendo que los archivos se dividen en paquetes de tamaño fijo, di cómo se llaman, qué
tamaño tienen y cómo se identifican estos ficheros.
8. ¿Cuáles son las tres ventajas principales de utilizar fragmentos grandes de archivos?
9. En cuyo caso puede suceder que las réplicas de un mismo fragmento contenga datos
diferentes?
12. ¿Cuáles son las limitaciones de la arquitectura con un solo máster de GFS? De qué
maneras se han superado estas limitaciones?
13. ¿Qué diferencias hay entre el propósito inicial de GFS y los casos de uso en que se ha
acabado utilizando el sistema? ¿Qué soluciones se han encontrado para los problemas
surgidos a raíz de la diferencia entre su propósito original y su uso real?
RD – Guía 4/24
REDES DISTRIBUIDAS (RD)
Guía y orientaciones
1. ¿Qué es la BigTable?
9. Pon dos ejemplos de aplicaciones reales y cómo se benefician cada una de la BigTable.
Destaca el papel del MapReduce.
10. ¿Qué problemas de tolerancia a fallos han resuelto en este sistema de gran escala?
11. Qué diferencias hay respecto a los sistemas P2P estructurados como Chord o Pastry?
RD – Guía 5/24
REDES DISTRIBUIDAS (RD)
Guía y orientaciones
8. Como se da cuenta el sistema HDFS que ha habido un fallo en alguno de los equipos?
RD – Guía 6/24
REDES DISTRIBUIDAS (RD)
Guía y orientaciones
2. Qué rol lleva a cabo Dynamo dentro de la plataforma y qué clase de servicio mujer a las
aplicaciones?
3. Qué requerimientos tiene una plataforma de comercio electrónico como Amazon con
millones de clientes? Destaca dos y razónalos.
6. ¿Qué requerimientos tienen los servicios que son más adecuados para utilizar Dynamo?
Descríbelos brevemente.
9. ¿A qué nivel se sitúa Dynamo dentro de la arquitectura de Amazon y cómo afronta las SLAs?
10. ¿Qué tipo de replicación utiliza Dynamo? Qué consideraciones hay que tener en cuenta de
cara a la resolución de conflictos?
14. Describe y compara brevemente las tres estrategias de balanceo de carga. ¿Cuál demuestra
ser más eficiente?
15. ¿Qué beneficios han demostrado tener las aplicaciones y servicios que utilizan Dynamo?
RD – Guía 7/24
REDES DISTRIBUIDAS (RD)
Guía y orientaciones
[05a] Michael Armbrust, Armando Fox, Rean Griffith, Anthony D. Joseph, Randy Katz, Andy
Konwinski, Gunho Lee, David Patterson, Ariel Rabkin, Ion Stoica, and Matei Zaharia. 2010. A view
of cloud computing. Communications. ACM 53, 4 (April 2010), 50-58.
[05b] Peter Mell, Tim Grance. The NIST Definition of Cloud Computing. July 2009.
[06] Jeffrey Dean and Sanjay Ghemawat. 2008. MapReduce: simplified data processing on large
clusters. Commun. ACM 51, 1 (January 2008), 107-113.
[07] Peter Bailis and Ali Ghodsi. 2008. Eventual Consistency Today: Limitations, Extensions, and
Beyond. Queue 11, 3, pages 20 (March 2013), 13 pages.
RD – Guía 8/24
REDES DISTRIBUIDAS (RD)
Guía y orientaciones
6. ¿Cuál es el principal beneficio para los desarrolladores que utilizan este paradigma?
8. ¿Se puede considerar que los “data centers” convencionales aportan todos los beneficios de
un “cloud” público? Compáralos.
9. ¿Qué es lo que necesita cualquier aplicación para ser distribuida y que el “cloud” le
proporciona?
10. ¿Qué técnica utiliza el “cloud” para proporcionar un nivel de elasticidad de servicios sin
límites aparentes?
11. ¿Cuáles son los obstáculos principales que afectan al crecimiento de un “cloud”?
12. ¿Qué nivel de disponibilidad se espera de un “cloud”? ¿Es fácil de conseguir? Razona tu
respuesta.
13. Crees que el “cloud” tendría que mejorar el rendimiento de cada nodo individualmente o
es preferible buscar una escalabilidad horizontal? Razona la respuesta.
RD – Guía 9/24
REDES DISTRIBUIDAS (RD)
Guía y orientaciones
1. ¿Qué es el MapReduce?
RD – Guía 10/24
REDES DISTRIBUIDAS (RD)
Guía y orientaciones
6 . ¿Qué métricas se pueden utilizar para medir la consistencia dada por un sistema con
“consistencia eventual” ?
8 . ¿Qué dice el teorema CALM ? ¿Cuáles son sus implicaciones a la hora de construir sistemas
con “consistencia eventual” ?
9 . ¿Qué son los CRDTS y qué utilidad tienen a la hora de construir sistemas distribuidos? Pon
un ejemplo.
RD – Guía 11/24
REDES DISTRIBUIDAS (RD)
Guía y orientaciones
En este tercer bloque estudiaremos dos paradigmas de sistemas distribuidos de gran escala que
tienen un importante denominador común: la presencia de dispositivos de usuario domésticos
como parte integral de su arquitectura.
1) Los artículos que discuten los fundamentos teóricos de los paradigmas P2P y volunteer
computing [08][09].
2) Los artículos que describen sistemas reales basados en estos paradigmas [10][11].
[08] Eng Keong Lua; Crowcroft, J.; Pias, M.; Sharma, R.; Lim, S. A survey and comparison of
peer-to-peer overlay network schemes. Communications Surveys & Tutorials, IEEE , vol.7, no.2,
pp.72,93, Second Quarter 2005.
[09] Beberg, A.L.; Ensign, D.L.; Jayachandran, G.; Khaliq, S.; Pande, V.S. Folding@home: Lessons
from eight years of volunteer distributed computing. Parallel & Distributed Processing, 2009.
IPDPS 2009. IEEE International Symposium on , vol., no., pp.1,8, 23-29 May 2009
[10] Xia, R.L.; Muppala, J.K. A Survey of BitTorrent Performance. Communications Surveys &
Tutorials, IEEE , vol.12, no.2, pp.140,158, Second Quarter 2010.
[11] Kreitz, G.; Niemela, F. Spotify - Large Scale, Low Latency, P2P Music-on-Demand
Streaming. Peer-to-Peer Computing (P2P), 2010 IEEE Tenth International Conference on , vol., no.,
pp.1,10, 25-27 Aug. 2010.
RD – Guía 12/24
REDES DISTRIBUIDAS (RD)
Guía y orientaciones
3. ¿Cuáles son los dos tipos principales de sistemas P2P? Destaca tres ejemplos de cada tipo.
10. ¿Qué es un servicio CAST? Relaciónalo con los conceptos de DHT y KBR. Pon un ejemplo.
11. ¿Cuál es el impacto de crear topologías virtuales (overlays) con un número elevado de
nodos y conexiones entre ellos sobre redes reales con enrutadores y conexiones y físicas.
13. ¿Qué tipo de aplicaciones además del “file-sharing” se pueden desarrollar con la
tecnología P2P?
RD – Guía 13/24
REDES DISTRIBUIDAS (RD)
Guía y orientaciones
3. ¿Qué mecanismos son más necesarios para el “volunteer computing” de gran escala?
4. ¿Cuál es el mayor cambio en los más de treinta años de vida de este paradigma? ¿Qué
consecuencias implica este hecho?
7. Cuál es el problema que se encuentran los científicos cuando utilizan estos sistemas tan
heterogéneos con diferentes clientes y sistemas operativos?
9. En términos de sistemas distribuidos, cuáles son las tareas del “assigment server”?
12. ¿Qué problemas hay que resolver en este tipo de sistemas distribuidos?
RD – Guía 14/24
REDES DISTRIBUIDAS (RD)
Guía y orientaciones
1. ¿Cuáles son las principales diferencias entre BitTorrent y las aplicaciones “file-sharing” P2P
tradicionales?
2. ¿Qué es un “torrent”? ¿Qué efecto tiene un aumento de usuarios por el mismo “torrent”?
11. ¿Qué dos partes del protocolo son más susceptibles a mejora? Describe brevemente dos
mejoras por cada una de ellas.
12. ¿A qué otro tipo de aplicaciones han influenciado los mecanismos de BitTorrent?
RD – Guía 15/24
REDES DISTRIBUIDAS (RD)
Guía y orientaciones
3. Cómo diferencia a Spotify su naturaleza P2P de las aplicaciones de audio por streaming
cliente servidor?
5. ¿Qué tipo de aproximaciones streaming P2P existen? ¿Cuál de estas es mejor para
aplicaciones bajo demanda?
RD – Guía 16/24
REDES DISTRIBUIDAS (RD)
Guía y orientaciones
Bloque 4. Networking
En este cuarto bloque trataremos diferentes temas relacionados directamente con las redes
distribuidas.
Específicamente, estudiaremos su rendimiento actual [13], como funcionan los centros de datos de
gran capacidad [14] y estudiaremos los sistemas de coordenadas [15].
[12] Tom Leighton. 2008. Improving Performance on the Internet. Queue 6, 6 (October 2008), 20-
29.
[13] Abts, D.; and Felderman, B. A guided tour of data-center networking. Commun. ACM 55, 6
(June 2012), 44-51.
[14] Donnet, B.; Gueye, B.; Kaafar, M.-A. A Survey on Network Coordinates Systems, Design, and
Security. Communications Surveys & Tutoriales, IEEE , vol.12, no.4, pp.488,503, Fourth Quarter
2010
[15] Drago, I.; Mellia, M.; Munafo, M.; Sperotto, A.; Sadre, R.; and Pras, A. Inside dropbox:
understanding personal cloud storage services. In Proceedings of the 2012 ACM conference on
Internet measurement conference (IMC '12). ACM, New York, NY, USA, pp. 481-494.
RD – Guía 17/24
REDES DISTRIBUIDAS (RD)
Guía y orientaciones
RD – Guía 18/24
REDES DISTRIBUIDAS (RD)
Guía y orientaciones
11. ¿A qué niveles actúa el control de flujo? Cómo afecta a las aplicaciones?
13. ¿Cómo se despliega un “data center” de gran escala? ¿Cómo afecta a la experiencia de
usuario?
RD – Guía 19/24
REDES DISTRIBUIDAS (RD)
Guía y orientaciones
1. ¿Qué problema quieren resolver los sistemas NCS? Que permiten hacer?
6. ¿Qué tipo de sistemas de localización existen? Describe brevemente las soluciones más
conocidas.
13. ¿Cuál es la ventaja principal de las propuestas distribuidas respecto a los sistemas basados
en “landmarks”? ¿Y el inconveniente principal?
RD – Guía 20/24
REDES DISTRIBUIDAS (RD)
Guía y orientaciones
1. En Dropbox, los ficheros se dividen en trozos. Cada trozo se identifica con el valor
resultante de aplicar la función de hash SHA256 sobre su contenido. Si un fichero de 400 MB se
divide en 100 trozos, qué volumen de metadatos en bits se genera para representar el fichero?
¿Es el volumen de metadatos óptimo en relación al tamaño del fichero?
2. El cliente de Dropbox envía el hash de cada trozo a los servidores de metadatos de Dropbox.
Si el hash no existe en los servidores, el cliente sube el correspondiente trozo a los servidores
de almacenamiento. Caso contrario, el trozo no se sube porque ya existe una copia en el
servidor. Esta técnica se conoce como deduplicación. ¿Qué tipo de deduplicación usa
Dropobox? La respuesta se encuentra en la sección “Data Deduplication Strategies” del
artículo titulado “Side Channels in Cloud Services: Deduplication in Cloud Storage” por D.
Harnik, B. Pinkas y A. Shulman-Peleg.
4. ¿Qué tipo de notificación usa Dropbox para indicar a un usuario que tiene un fichero sin
sincronizar? ¿En qué sentido aumenta la escalabilidad del servicio?
6. ¿De qué tamaño son generalmente los flujos de almacenamiento de Dropox? ¿Esto significa
que Dropbox es eficiente en cuánto al ahorro de tráfico de red? Relaciona tu respuesta con la
técnica de deduplicación que emplea Dropbox.
7.Describe qué efecto tiene el algoritmo de comienzo lento (Slow-start) del protocolo TCP
sobre los flujos de almacenamiento con poco volumen de datos.
8. Explica qué patrón de conexión siguen los usuarios de Dropbox ¿Qué efecto puede tener
sobre los centros de datos que almacenan los datos de los usuarios?
11. Comenta las tres mejores propuesta por las autores del artículo para mejorar la calidad de
servicio de Dropbox.
12. Comenta por qué es ventajoso agrupar trozos en las operaciones de almacenamiento.
RD – Guía 21/24
REDES DISTRIBUIDAS (RD)
Guía y orientaciones
Bloque 5. Miscelánea
En este último bloque estudiaremos los artículos que por su temática han quedado fuera de los
ámbitos tratados en los bloques teóricos anteriores.
[16] Ian Sommerville, Dave Cliff, Radu Calinescu, Justin Keen, Tim Kelly, Marta Kwiatkowska, John
Mcdermid, and Richard Paige. 2012. Large-scale complex IT systems. Commun. ACM 55, 7 (July
2012), 71-77.
[17] Matthew Edman and Bülent Yener. 2009. On anonymity in an electronic society: A survey of
anonymous communication systems. ACM Comput. Surv. 42, 1, Artículo 5 (December 2009), 35
pages.
RD – Guía 22/24
REDES DISTRIBUIDAS (RD)
Guía y orientaciones
10. ¿Explica las diferencias clave entre PhD y un “doctorado de ingeniería (UK)”? Por qué
graduar unos cuántos doctorados no se suficiente ?
RD – Guía 23/24
REDES DISTRIBUIDAS (RD)
Guía y orientaciones
6. ¿Cuáles son los dos tipos de adversarios que se tienen en cuenta a la hora de probar el grado
de anonimato que proporciona un sistema?
7. Explica muy brevemente los aspectos principales de cada uno de estos tipos.
8. Explica brevemente como funciona una red “Mix” en sistemas de anonimato de alta
latencia.
9. Explica como funciona y qué son las principales características que ofrece
“Anonymizer.cómo”.
11. Explica como funciona “Tor”. ¿Cómo funciona los “hidden services”?
13. ¿En que consiste el ataque “fingerprinting” a un lugar web? ¿Cómo se puede debilitar?
14. ¿En que consiste el ataque llamado “timing”? ¿Cómo se puede debilitar?
RD – Guía 24/24