Genbeta

Test automáticos con QuickCheck ¿Cómo analizar nuestro código en busca de bugs?

Jose Juan — Mon, 03 Oct 2016 06:00:49 +0000

Verificar que nuestro código está libre de bugs es una tarea muchísimo más complicada de lo que pudiera parecer en un principio. El número de relaciones que se producen entre las piezas de código que vamos añadiendo aumenta de forma vertiginosa y desgraciadamente nadie parece saber aún la forma de escribir código libre de bugs. No deja de ser sorprendente que el datamining y en particular el machine learning no se apliquen de forma efectiva dada la ingente cantidad de programadores que hay en el mundo escribiendo cabezonamente el mismo código y cometiendo una y otra vez los mismos errores.

Hasta entonces, una de las herramientas que puede sernos de utilidad a la hora de validar nuestro código es QuickCheck, que nos permite escrutar automática y probabilísticamente nuestros algoritmos para encontrar errores.

¿Dónde se esconden los bugs?

La experiencia nos muestra que un programador senior genera menos bugs que un programador junior, e igualmente tenemos la sensación de que un programador senior escribirá test de mejor "calidad" que un programador junior pero, ¿porqué?, ¿qué significa que un test es de mejor "calidad" que otro?

Intuitivamente reconocemos relaciones que la experiencia parece confirmar. Si escribimos un proceso que trabaja con cadenas y éste es verificado para palabras como "canario", "baloncesto" o "picapiedra" nos sorprendería que fallara para palabras como "campanario", "balonmano" o "piedrafita". Nos sorprendería menos encontrar un error al verificar con cadena vacía, símbolos o de longitudes "diferentes". Si se trata de cierto cálculo contable (totales, descuentos, etc...) nos sorprendería que fuera validado para importes como 10.25, 123.00 o 75.73 pero no para otros como 10.15, 232.00 o 73.75.

Y nos sorprendería porque, si bien todos sabemos que terminan apareciendo bugs que fallan con "balonmano" pero no con "baloncesto" o con 232.00 pero no con 123.00, no son los más frecuentes.

Así, siempre de forma empírica e intuitiva los bugs suelen agruparse en clases (no excluyentes); es decir, existen clases de parámetros para los cuales nuestro código es o no correcto. Como en los ejemplos anteriores, si verificamos que nuestro código funciona para las cadenas "", "A", "AA", "AAA", "AAAAA", "AAAAAAA", ... (número primo de aes) nos sorprendería que no funcionara para un número no primo de aes... ¡salvo que nuestro algoritmo esté relacionado de alguna forma con la primalidad!

Si supiéramos identificar, ¡para cada algoritmo!, las clases de parámetros que producen el mismo resultado en nuestro test sólo tendríamos que revisar un representante de cada clase y no todos.

Quickcheck

QuickCheck realiza de forma automática una búsqueda sobre el dominio de los parámetros intentando recorrer, precisamente, las más clases de parámetros que hemos indicado antes de forma que para cada test se realice una evaluación transversal.

Nosotros entonces, únicamente suministramos una propiedad que debe cumplirse en la hipótesis de que nuestro código sea correcto (un invariante) y Quickcheck lo revisará generando automáticamente los parámetros.

Por ejemplo, supongamos la siguiente función en Java que indica si dos cadenas son idénticas:


public static boolean equalStrings(String a, String b) {
    boolean equals = a.length() == b.length();
    if(equals)
        for(int i = 0; i < a.length(); i++)
            equals = a.charAt(i) == b.charAt(i);
    return equals;
}

Entonces usando una implementación de Quickcheck en Java podríamos verificar si se cumple que cualquier cadena es igual a ella misma con el siguiente test:


@Property
public void equalToItself(String xs) {

    assertTrue("Cualquier cadena es igual a ella misma",

            Foo.equalStrings(xs, xs));

}

Quickcheck (en este caso bajo JUnit) lanzaría 100, 500 o los test que sean y obtendríamos que todo es correcto. Podríamos verificar también que una cadena a la que se añade una X nunca es igual a esa misma cadena añadiéndole una Y con un test como:


public void differentSuffix(String xs) {

    assertFalse("Cualquier cadena con diferentes sufijos nunca es igual",

            Foo.equalStrings(xs + "X", xs + "Y"));

}

Y obtendríamos también que nuestra función funciona perfectamente.

Buscando invariantes

Aunque Quickcheck es una herramienta fantástica para generar automáticamente argumentos para nuestros test, no debemos olvidar que el dominio de búsqueda aumenta exponencialmente con el tamaño de nuestros parámetros. Una función que toma como argumento tan sólo dos números de 32 bits tiene un dominio de 2⁶⁴ = 18.446.744.073.709.551.616 elementos.

Por ello, la elección de los invariantes a verificar sigue siendo crítica, por lo que debemos buscar entre aquellos que conecten relaciones utilizadas en la implementación pero de forma que cubran el dominio (no poner invariantes por poner). Pensemos en como hemos verificado que nuestra función equalStrings es correcta, ¿cuantos casos de entre todos los posibles hemos descartado con los dos test que hemos lanzado sobre la función equalStrings? ¡poquísimos! porque de todos los pares de cadenas posibles, las cadenas iguales y las cadenas que sólo discrepan en la última posición (¡aunque consideremos las infinitas cadenas iguales y las infinitas cadenas que sólo discrepan en la última posición!) son sólo dos casos de entre otros muchos posibles, de hecho, probemos con el mismo test anterior pero en lugar de sufijos, prefijos:


@Property
public void differentPrefix(String xs) {

    assertFalse("Cualquier cadena con diferentes prefijos nunca es igual",

            Foo.equalStrings("X" + xs, "Y" + xs));

}

¡caramba! ahora el test falla y nos indica un problema en nuestra implementación.

Conclusión

Los test "básicos" o los de regresión son triviales de implementar porque no pretenden validar la implementación, para hacerlo, deben generarse buenos test y ésto dista mucho de ser fácil. Quickcheck nos permite generar con facilidad miles o millones de casos de prueba pero sigue siendo crítico saber identificar el tipo de código que estamos intentando validar para buscar y definir aquellos invariantes que son más "transversales" a las clases de parámetros para los cuales es mas sensible nuestro código.

No ha sido mi intención escribir un tutorial sobre Quickcheck, sino llamar la atención sobre dicha herramienta y destacar la importancia de comprender cuando, cómo, porqué y en qué medida funciona la búsqueda de bugs mediante test unitarios. Si quieres darle una oportunidad, es probable que haya una implementación para tu lenguaje favorito.

Crystal, el sucesor de Ruby

Jose Juan — Wed, 10 Aug 2016 06:00:40 +0000

Ruby es un lenguaje de programación muy popular creado por Yukihiro Matsumoto en el año 1993 porque no le terminaban de convencer lenguajes como Perl o Python y deseaba un scripting language con un genuino soporte a la POO. Sin duda creó un lenguaje que satisface a muchos programadores sin embargo, una de las recurrentes fricciones que se producen en el mundillo es la de cual es el sistema de tipos más adecuado.

Al usar Ruby duck typing, se complica o hace imposible realizar algunos análisis deseables en los programas escritos. Sin duda ésta es la razón de que los creadores de Crystal hayan optado por emular Ruby usando un sistema de tipos estático.

Objetivos de Crystal

Los objetivos marcados por los desarrolladores de Crystal son:

Sintaxis similar a la de Ruby
Tipado estático con inferencia
Fácil integración con C
Evaluación y generación de código en tiempo de compilación (vía macros)
Generación de código nativo eficiente

En realidad y siempre en mi opinión, el tipado estático no es un requisito en si mismo, sino la forma de conseguir análisis del código y generación de código eficiente. Es el cambio de tipado dinámico (y duck) a estático donde está el reto, la dificultad y el éxito si logran hacerlo de forma práctica y eficiente.

Tipado estático e inferencia

Resulta un tanto curiosa la forma en que Crystal aplica las reglas de inferencia (parte 1 y parte 2) y las estructuras admitidas, seguramente debido al requisito de ajustarse en lo posible a la sintaxis de Ruby. Por ejemplo el siguiente código es válido:


a = 1       # a is Int32
a.abs       # ok, Int32 has a method 'abs'
a = "hello" # a is now String
a.size    # ok, String has a method 'size'

Esto obliga en general a que Crystal tenga que lidiar con uniones de tipos en tiempo de ejecución, generando estructuras como:


struct Int32OrString {
  int type_id;
  union {
    int int_value;
    string string_value;
  } data;
}

Aunque realiza cierta optimizaciones cuando reconoce que en ciertas ramas del código el tipo actual de cierto identificador es uno dentro de la unión, es decir, no siempre debe evaluar type_id en tiempo de ejecución.

Con esta capacidad, ahora Crystal puede realizar un análisis que Ruby no podía como por ejemplo en:


if n > 3
  a = 1
  a.abs
else
  a = "hello"
end
a.size

Donde puede intuirse que la intención del programador era devolver bien el valor absoluto de a bien la longitud de la cadena "hello" y a.size debe estar al final y dentro del bloque else (no fuera). Crystal advierte con un error que el método .size no existe para todos los tipos posibles en la unión actual (Int32 en este caso).

Por lo demás, parece que la inferencia únicamente analiza el AST de abajo a arriba, requiriendo en todo momento que los tipos estén definidos. Para el caso de genéricos en Crystal, deja libre el tipo hasta que quede definido en el uso y generando uniones de tipos en caso de ser preciso. Esto hace que, en principio, las capacidades del sistema de tipos esté al mismo nivel que otros como en Java o C#.

El tipo `NoReturn`

Como Crystal acarrea el tipo de cada expresión, usa el tipo NoReturn para indicar que nada es devuelto como en:


a = ...
if a == 1
  a = "hello"
  puts a.size
  raise "Ouch!"
else
  a = 2
end
a # here `a` can only ne `Int32`

Deduciendo que, de continuar con else, el tipo de a será Int32. Aunque de apariencia puntual, un buen uso de la inferencia de este tipo puede ser útil para la detección de edge cases que puede ser aprovechado por herramientas de análisis de cobertura y testing.

Filtrado de tipos

De forma reflexiva y dada la unión de tipos anterior, en determinados casos puede chequearse si el valor de la unión corresponde a un tipo o a otro como en los dos casos siguientes:


if a.is_a?(Int32)
  a.abs
end

if a.responds_to?(:abs)
  a.abs
end

En el primero se reflexiona sobre si a es un Int32 y en el segundo si el tipo que contiene a en ese momento admite el método abs.

Desafortunadamente, existen relaciones no resueltas en esta estrategia que hace que no sea consistente y deba parchearse:


a = some_condition ? 1 : nil
if !a
else
  a.abs # should be ok, but now gives error
end

Adicionalmente, dicha reflexión parece funcionar únicamente en variables locales y no en miembros de instancia y clausuras. Parece por tanto un uso muy limitado y obvio de reflexión.

Macros

Crystal posee un lenguaje propio de macros similar a otros lenguajes en que podríamos destacar la posibilidad de definir hooks cuando se producen ciertas situaciones al compilar, por ejemplo cuando se intenta invocar un método desconocido method_missing.


# macro `inherited`
class Parent
  macro inherited
    def {{@type.name.downcase.id}}
      1
    end
  end
end

class Child < Parent
end

Child.new.child #=> 1

# macro `method_missing`
macro method_missing(call)
  print "Got ", {{call.name.id.stringify}}, " with ", {{call.args.size}}, " arguments", '\n'
end

foo          # Prints: Got foo with 0 arguments
bar 'a', 'b' # Prints: Got bar with 2 arguments

En mi opinión, extender el lenguaje mediante macros o usarlas para generar estrategias "por encima" del lenguaje me parece muy arriesgado, si bien permite realizar análisis interesantes como quien, cuando y cómo hereda cierta clase.

Rendimiento

Uno de los aspectos importantes que parece desea resolver Crystal es el rendimiento, indicando que está cercano a C. No obstante, usando el propio ejemplo que ellos usan se aprecia un degradamiento importante. Comparando:


require "big"
require "option_parser"

def fib(n)
  a = BigInt.new(0)
  b = BigInt.new(1)
  n.times do
    a += b
    a, b = b, a
  end
  a
end

n = 10

OptionParser.parse! do |parser|
  parser.banner = "Usage: fib "
  parser.on("-n NUMBER", "Fib ordinal to print") { |o| n = Int64.new(o) }
end

puts (fib(n) % 1000000)

# [josejuan@centella crystal]$ crystal build test.cr && time -f "%E, %M" ./test -n 432101
# 396101
# 0:11.67, 4252

Con una sencilla implementación en Haskell


{-# LANGUAGE BangPatterns #-}
import System.Environment

fib n = f 0 0 1
  where f !k !a !b = if n ≡ k then a else f (k + 1) b (a + b)

main = getArgs ↪ print ∘ (`mod` 10⁶) ∘ fib ∘ read ∘ head

{-
[josejuan@centella centella]$ stack exec -- ghc -O3 ../crystal/fib.hs && time -f "%E, %M" ../crystal/fib 432101
396101
0:01.49, 5476
-}

Se obtiene mucha diferencia para un ejemplo tan sencillo, pues ambos lenguajes usan la misma librería para manipular números enteros grandes (GMP), aunque es posible que haya algún tipo de tunning que pueda hacerse en la versión Crystal o que aún tengan que mejorar.

Ecosistema y conclusiones

Aunque incipiente, Crystal cuenta con un repertorio de API suficiente para empezar a hacer algunos proyectos, cuenta con cierto soporte a concurrencia mediante channels y la documentación parece razonablemente cuidada. Los amantes de Ruby o phytonistas son firmes candidatos a darle una oportunidad a este lenguaje que promete mejorar un lenguaje como Ruby que, tras más de 20 años, sigue estando entre los lenguajes más populares.

Como lenguaje veo un popurrí de ideas y estrategias que quizás funcionen bien en la práctica y hagan que sea un lenguaje práctico y útil durante las próximas décadas, pero ninguna de ellas con una proyección global y que puedan crecer a largo plazo (obviamente excluyendo el hecho de usar un sistema de tipos estático).

En todo caso y como mínimo, me parece un valiente intento por dotar a un lenguaje dinámico (y duck para mas señas) de una estructura estática que permita realizar análisis del código en tiempo de compilación. De conseguirlo, se abre sin duda una gran cantidad de posibilidades para ampliar el tooling de sus programadores.

En Genbeta Dev | Aterrizando en la programación funcional

Aterrizando en la programación funcional

Jose Juan — Tue, 26 Jul 2016 08:40:22 +0000

¿Por qué la programación funcional suscita tanto interés?, ¿qué la diferencia del principal paradigma imperativo usado en la industria?, ¿en que grado deberías/podrías sacar partido a la programación funcional? Este tipo de cuestiones aparecen de forma recurrente entre aquellos que observan con curiosidad o recelo los movimientos de los lenguajes por incluir características de programación funcional.

Aunque el tema es amplísimo, complejo e inevitablemente propenso al partidismo y subjetividad, intentaré desde mi modesta experiencia apuntar algunas ideas que quizás, te respondan a estas cuestiones.

La programación funcional puesta en práctica

En un sentido ~~ontológico~~ práctico y dejando de lado definiciones formales, yo diría que la programación funcional consiste en determinar, entender y fijar las relaciones existentes entre los objetos que utilizamos al programar.

Por ejemplo, el principio de sustitución de Liskov determina y permite entender una relación existente entre una jerarquía de objetos en la programación orientada a objetos. Esa conexión, encontrada, entendida y fijada por Barbara Liskov es en cierto sentido, un ejercicio de programación funcional.

Es muy posible que todo esto de relaciones, principios, teoremas, ... te parezca demasiado profundo para total, escribir tan sólo algo de código que lea un archivo por aquí, imprima algunas líneas por allá, ... pero parece razonable pensar que la calidad del código que escribamos estará directamente relacionada con el conocimiento que tengamos sobre qué significa escribir código.

Veamos las siguientes líneas de javascript:


var x = ~~cadena;
if( a ) {
  y = f(x, a);
} else {
  y = g(x);
}

Muchos programadores no verán ningún problema con este código y no le darían mayor importancia pero, pensemos por un momento en algunas de las relaciones que no hay ahí:

parece que cadena debería ser una secuencia de dígitos quizás precedida por un + o un - pero nada impide que sea un objeto Date, un número, undefined, ...
existe una relación obvia entre el chequeo de "nulidad" de a y que se usen las funciones f o g pero nada impide intercambiar las expresiones y evaluar f cuando a es nulo
y deberíamos suponer que los comportamientos de f y g están relacionados de alguna forma, aunque nada impide usar ahí cualquier otra función h, i, ... o que hagan y devuelvan cosas diferentes

Así, seamos o no conscientes, existen multitud de relaciones tácitas en el código que escribimos, que forman parte de la implementación aunque el lenguaje no las considere y que podrían ser utilizadas para escribir código más seguro, eficiente y conciso.

Seguramente una de las relaciones más obvias que pueden fijarse cuando programamos son los tipos pues, al escribir int y = g(x) se está poniendo de manifiesto una relación entre y y la función g. Pero la programación funcional establece muchas relaciones que no se limitan al sistema de tipos del lenguaje.

Con la programación funcional, de forma similar al principio de sustitución de Liskov, se busca encontrar, poner de manifiesto todas las relaciones posibles y utilizarlas para escribir código mas eficaz.

En C#, podríamos utilizar la sintaxis de LINQ para enlazar código (fijar relaciones) que requiere cierto valor pero que quizás está o no disponible y la sobrecarga de operadores para seleccionar el primero por la izquierda que sí posea un valor, algo como:


Quizás<int> y = from x in atoi(cadena)
                from r in (from o in notNull(a) select f(x, o)) | g(x)
                select r;

En el código anterior, la función atoi y la función g devuelven quizás un entero (Quizás) y la función notNull devuelve quizás un objeto nulable (Quizás) pero la función f requiere valores y sólo se evalúa cuando notNull(a) contiene un valor. La tubería devuelve el primer valor por la izquierda que sí posea valor (o ninguno si ninguno lo tiene) en expresiones como q1 | q2 | q3. Es la estructura interna codificada (en otro sitio) usando la sintaxis LINQ y operador | la que realiza la lógica de los Quizás y es tan general y reusable como las propias del lenguaje: if, switch, ...

Revisemos de nuevo algunas de las relaciones anteriores:

podemos usar x con seguridad, puesto que las computaciones debajo de from x no serán evaluadas si atoi falló. Y no hay otra forma de acceder a x (la compilación fallaría).
podemos usar o con seguridad por la misma razón, es imposible acceder a a si es nulo.
la relación entre f y g está implícita pues la familia de computaciones admitidas está restringida a las que devuelven Quizás. Y eso, que el tipo de retorno de f y g es diferente.

En lenguajes con sintaxis más adecuadas podría quedar (ej. Haskell):


let y = do  x <- atoi cadena
            (f x <$> notNull a) <|> g x

La programación funcional busca esas relaciones y define estructuras y estrategias que, como el ejemplo de C#, refinan y aseguran otras previas.

Por tanto, la programación funcional no es hacer un "reduce-map" o usar listas por comprehensión, sino entender y usar relaciones de una forma que, en la práctica, está mostrando algunas ventajas frente a otros paradigmas.

Comparativa de algunas estrategias

El ejemplo anterior muestra como controlar el flujo según el resultado de las operaciones intermedias. Un ejemplo real (en el que he cambiado los nombres de los símbolos para respetar la fuente) transformado a un estilo funcional podría ser la siguiente función:


        bool ShowControl(Request request) {
            IControlFinder finder;

            if (!Api.TryResolveInjection(out finder)) {
                return false;
            }

            var control = finder.FindControl(request);
            if (control == null) {
                return false;
            }

            if (control.ViewData != null) {
                return true;
            }

            var service = Api.ResolveInjection<IViewDataTransformer>();
            var viewData = service.ViewFromData(request);
            control.ViewData = viewData;
            return true;
        }

como en el ejemplo anterior, hay unas cuantas relaciones "no resueltas" como que la inyección de la dependencia a IViewDataTransformer puede fallar o, quizás, la generación de los datos de la vista. También se observan diferentes convenciones para indicar éxito como en Try o los chequeos de null. Quien lo codificó decidió no añadir ahí aserciones como comentábamos en To throw or not to throw o para que sirven las excepciones.

Usando una estilo aplicativo y la notación LINQ anterior podría ser algo como



Quizás<Void> ShowControl(Request request) {
   return from finder  in Api.GetFinder()
          from control in finder.FindControl(request)
          from success in control.ViewData
                        | from service  in Api.GetService()
                          from viewData in service.ViewFromData(request)
                          from result   in control.SetViewData(viewData)
                          select result
          select success;
}

o de forma similar en Haskell algo como


viewFromRequest :: Request -> Control -> API ()
viewFromRequest r c = withService (viewFromData r) >>= setViewData c

showControl :: Request -> API ()
showControl request = do  control <- withFinder $ findControl request
                          viewData control <|> viewFromRequest request control

Otro pequeño ejemplo consiste en cómo se realiza la inyección de dependencias o, mejor dicho, cómo no se realiza ningún tipo de inyección de dependencias.

En el código anterior hemos visto que nuestra Api hace uso de cierto servicio (Api.GetService) para realizar la acción que sea. Con el fin de desacoplar esa acción que necesitamos con quien finalmente realizará la acción se tiene la inyección de dependencias.

Muy por encima, la inyección de dependencias se puede dividir en dos aspectos:

cual es la acción que queremos ~~independizar~~ desacoplar.
de qué forma consigo yo un objeto que me proporcione dicha acción.

La forma más básica (de inversión) es mediante callbacks, cuya firma resuelve el primer punto. Pasarlos como argumento es también la forma más básica de resolver el segundo punto.

Pero pasarlo como argumento requiere ir arrastrándolo "por ahí", por lo que se suele tirar de reflexión para ~~inyectarlo~~ resolverlo en tiempo de ejecución a partir de algún fichero de configuración (ej. Web.config), anotaciones (@Inject), singleton global (ej. Routes.cs), ...

En la programación funcional y usando mónadas, las computaciones se definen dentro de un contexto sobre el que el programador ha decidido abstraer su problema, formalmente, nada que no se haya previsto en ese contexto está permitido realizar (puedes leer sobre ello en Usar mónadas es mucho más fácil de lo que crees, empezando con la programación funcional) y por tanto si nuestra función showControl va a necesitar instanciar un Finder nuestro contexto debe permitirlo. A partir de ahí, cualquier computación dentro de ese contexto tiene disponible esas ~~computaciones~~ definiciones sin necesidad de arrastrar explícitamente el contexto. Muy, muy burdamente sería como que nuestra Api entera consiste en una única clase parcial y la instancia concreta de cierto interface (ej. IHttpProvider) la tenemos accesible mediante algún getter (por hacerlo lazy).

En el ejemplo, los withService "recuperan" una computación permitida en el contexto, cuyas definiciones pueden estar en cualquier sitio (no dentro de una gran clase Api).

Otra estrategia muy usada en la programación funcional es la currificación o (no siendo exactamente lo mismo) aplicación parcial en que cierta función con argumentos es reducida a otra función con menos argumentos. De forma similar a la inyección de dependencias, aquí podemos tener computaciones configurables sin que haya que arrastrar la configuración (o inyectarla).

Por ejemplo, si tenemos cierta función que renderiza un informe, no hace falta pasar explícitamente las propiedades "locales" que tendrá el título (color, tipo de letra, ...) sino que ignoraremos esas propiedades dándolas por asumidas y sólo definiremos lo que queremos abstraer a ese nivel, en el ejemplo, la inversión se produce en el texto que habrá en el título:


renderizaInforme :: (String -> Picture) -> ... -> Picture
renderizaInforme titulo ... = do
  ...
  let tituloPic = titulo "Informe"
  ...
  pictures [ ..., tituloPic, ... ]

desacoplando la lógica de renderizado que sea con las particularidades del título. Posteriormente se podría definir como


data Mostrar = Informe | Menú | ...

interfazGráfica :: Mostrar -> Render ()
interfazGráfica Informe = withRender $ renderizaInforme (textPicture Red Bold)
interfazGráfica Menú = ...

-- donde cierta API gráfica define
data Color = Red | Blue | ...
data FontWeight = Normal | Bold | ...

textPicture :: Color -> FontWeight -> String -> Picture

Exponer aunque fuera sucintamente otros aspectos como la reducción (o fusión) total o parcialmente automática de computaciones enlazadas, la elevación al sistema de tipos de invariantes en nuestra aplicación (por ejemplo el routing en un servicio REST) o que la facilidad de crear DSL permite construir entornos seguros (el contexto del que hablábamos antes) sería largo y seguramente no los sabría exponer adecuadamente, pero espero que estos ejemplos hayan dado una pequeña idea.

Automatizando el principio de sustitución de Liskov

Las estrategias mostradas anteriormente suelen poderse aplicar a cualquier lenguaje, pero ya hemos apuntado la idea de que la programación funcional no es la aplicación de esas estrategias sino la capacidad intrínseca del paradigma para razonar, obtener conocimiento y aprovecharnos de ello.

¿No sería genial que el propio compilador nos advirtiera de que nuestra jerarquía de objetos está incumpliendo el principio de sustitución de Liskov?

Ese es el enfoque que motivan y potencian ciertos lenguajes resultando en herramientas como Proving Type Class Laws for Haskell (vía @Jose_A_Alonso) que permiten de forma automática probar que todas las instancias de cierto interface cumplen las ~~leyes~~ propiedades obligadas por el interface. O como fitspec que de forma automática nos indica si nuestros test de invarianzas (ej. la concatenación de cadenas implica suma de longitudes) cubren el dominio.

Problemas de la programación funcional

Un estilo funcional no está exento de inconvenientes, igual que otros paradigmas sufre del problema de expresividad de forma inversa a como ocurre con la POO por lo que dependiendo del problema podría no ser el enfoque más adecuado. La facilidad con la que pueden definirse estructuras globales (vía DSL, aplicación parcial, ...) supone con frecuencia que debemos "estudiar" el enfoque particular de ciertas apis que al principio puede sorprender, pues parecen otro lenguaje diferente. Por uno u otro motivo, las estructuras que suelen definirse provienen de las matemáticas, lo que supone por un lado una asunción de un conocimiento previo de las mismas (monoide, functor, ...) que quizás no existe y por otro lado un nivel de abstracción mayor, complicando la adopción de ciertas estrategias.

En todo caso, consigue un curioso efecto en el que las abstracciones quedan más desacopladas que con otros paradigmas y a la vez, son las definiciones las que tienden a estar mucho más acopladas llevándonos al dicho de que "si te compila Haskell, seguramente sea correcto".

To throw or not to throw o para que sirven las excepciones

Jose Juan — Mon, 11 Jul 2016 08:39:10 +0000

En el mundo impuro en el que vivimos se producen situaciones inesperadas que escapan a nuestro control. Es por ello que los programas necesitan un mecanismo mediante el cual poder controlar dichos casos excepcionales, al más común de esos mecanismos se le llama Exception handling. Sin embargo, el uso de excepciones tiene consecuencias en la calidad de nuestro código haciéndolo más frágil. ¿Podemos hacer algo al respecto?

Acción fantasmal a distancia

El principal problema con las excepciones es que realizan una acción fantasmal a distancia esto es, una situación excepcional ocurrida en cierto proceso inmerso en cierto contexto eleva esa situación sin concierto previo de ello a todos los procesos superiores en sus contextos superiores. Por ejemplo, tu tienes cierto código cuyo proceso consiste en sumar los importes de unas facturas y algún proceso profundo eleva una excepción cuando los datos de una factura están corruptos ¿que haces?, ¿dejas que la excepción se eleve e impides que los usuarios trabajen hasta que todas las facturas en liza se "arreglen"? no, seguramente con la idea de descartar las que "estén mal" intentarías capturar dicha excepción en el cuerpo que itera las facturas pero ésto, por desgracia, sólo agrava el problema que nos ocupa (aunque quizás tu aplicación funciona bien unos meses o incluso años si tienes suerte y no te piden modificárla jamás).

La cuestión es, que las excepciones suponen una interrelación tácita entre procesos en sus propios contextos, por lo que es difícil razonar y ser consciente de las implicaciones cuando ocurren.

El uso de excepciones hoy en día

Es completamente utópico pensar que vamos a poder establecer un marco que sustituya las excepciones fantasmales sin embargo, descontextualizaré torticeramente el artículo de Eric Lippert sobre Vexing exceptions para mostrar que el marco actual es notablemente mejorable. Él argumenta que no es posible actuar controladamente (sin usar excepciones) frente a, por ejemplo, el acceso a un fichero, dado que por muchas verificaciones que realices antes (existe, es de cierto tamaño, tienes permisos, ...) siempre puede ocurrir algo que rompa tu proceso de lectura. Es obvio que algo puede romper el proceso de lectura ¡pero no hay porqué andar lanzando excepciones a diestro y siniestro! la operación de lectura que eleva una excepción si ya no puede leer el fichero ¡está asumiendo que siempre podrá leer el fichero abierto! y eso, para nosotros, es mucho suponer (o no, y en tal caso no nos tendríamos que preocupar porque tal excepción se eleve).

Mi opinión es que cuando lanzamos una excepción, debemos asumir que el proceso entero que depende (directa o indirectamente) del que elevó la excepción se ha roto también y sólo es recuperable cuando no existe tal dependencia. Por ejemplo, el correcto funcionamiento del sistema operativo no depende del éxito o fracaso de la ejecución de mi programa (¿o sí?: isolation, containers, ...), luego si yo elevo una excepción él puede capturarla y decir, simplemente "abnormal program termination".

Otro ejemplo de uso "legítimo" podría ser la digestión de mensajes, nuestro worker debe seguir digiriendo mensajes aunque el proceso de uno de ellos falle estrepitosamente (ej. un bug que provoca NullPointerException) ¡pero sólo si el proceso entre mensajes es independiente!

Por supuesto, las excepciones son fantásticas para mantener de forma cómoda las aserciones en nuestro código y nos permiten validar importantes invariantes que, de no cumplirse, nos revelarán un bug.

Excepciones y recursos

Si el problema de la ruptura del proceso, no obtener el resultado esperado y que la acción fantasmal nos impide percibir adecuadamente las interrelaciones en nuestro código no te parecen pocos problemas, el hecho de lanzar una excepción obliga a todos los procesos intermedios a liberar todos los recursos que hubieran acaparado. Por fortuna en este caso, las interrelaciones suelen estar más claras, pues el contexto dentro de un } finally { normalmente estará bien definido.

La acumulación de ficheros temporales, un bloqueo sobre un fichero no liberado, la corrupción del estado persistente y otros similares son síntomas de que el programa falló sin una adecuada liberación de recursos. Este tipo de errores los vemos con frecuencia en el software que utilizamos.

Alternativa a `throw`

Hemos visto casos en los que las excepciones son un útil mecanismo. Huelga decir que el "uso creativo" de las excepciones como la famosa alternativa a la validación anidada estaría desaconsejada en general. Pero entonces ¿que alternativas tenemos para gestionar lo excepcional entre nuestros procesos interrelacionados?.

De las que yo conozco la que a mí me parece mejor resuelve el problema es la applicative style programming (o applicative functors) pues de una forma elegante permite mantener simultáneamente, cual programación orientada a aspectos se tratara, la ~~ortogonalidad~~ dualidad que nuestros procesos mantienen entre las acciones requeridas y las acciones excepcionales.

Pero eso mejor, otro día.

Usar mónadas es mucho más fácil de lo que crees, empezando con la programación funcional

Jose Juan — Mon, 27 Jun 2016 06:04:23 +0000

Seguramente todos tenemos formada una buena idea sobre lo que es una "propiedad", un "método estático", un "singleton" u otros términos de uso común. Nos resultan algo más exóticos e infrecuentes términos como "clase abstracta" o "función virtual pura". Todos éstos son términos habituales en la programación orientada a objetos. Lo que seguramente ya no tengamos tan claras son todas las ramificaciones, implicaciones, interacciones que todos éstos conceptos poseen y sin embargo los usamos. Usar una mónada es tanto o más fácil de usar que, por ejemplo, un objeto. Pero una mónada no es un objeto, y quien quiera comprender cómo usar una mónada tendrá que hacer el esfuerzo por desprenderse de viejas y apoltronadas preconcepciones.

¿Qué es una mónada?

Una mónada está bien definida. Podemos usar la definición de la foto de la portada si queremos adquirir las profundas y sesudas implicaciones que las mónadas poseen (y que yo desconozco por incapacidad manifiesta) o bien podemos usar otra más útil y pragmática como la usada en diversos lenguajes de programación y en particular la de Haskell. Sin embargo, para aprender informalmente lo que es una mónada, creo que es un error tomar como base la definición de mónada, la cual sólo es útil cuando ya se está cómodo usándolas.

¿A qué huelen las mónadas?

Huelen a "contexto". Cuando estás tumbado en el sofá de tu casa, estás en un contexto. Cuando estás conduciendo, estás en un contexto. Cuando estás buceando en el mar, estás en un contexto. Así, podríamos decir que las mónadas son contextos:


dormirLaSiesta :: Sofá ()
dormirLaSiesta = ...

regresarAlFuturo :: DeLoreanDMC12 ()
regresarAlFuturo = ...

brazada :: Buceando ()
brazada = ...

Por tanto, una mónada es fácil de usar pero lo más importante es que es segura de usar porque no habría ningún problema en que te quedaras dormido en el sofá, pero sí desastroso si te da por dormirte en el coche o mientras buceas.


irAlPueblo :: DeLoreanDMC12 ()
irAlPueblo = do
                ...
                encenderMotor
                meterPrimera
                acelerar
                dormirLaSiesta        -- por fortuna no compila
                ...

No veas posibles similitudes con los objetos. Un objeto protege sus datos y define sus métodos, pero no controla quién ni cómo es usado y es difícilmente extensible (ej. mixings). Una mónada controla quién y cómo es usada, no sólo protege posibles datos, sino todo el contexto en que se ejecuta y es trivial y necesariamente extensible.

¿Para qué sirven las mónadas?

Simple y llanamente para definir ~~una computación~~ un proceso que se ejecuta en un contexto. El ejemplo anterior irAlPueblo es un sencillo ejemplo, pongamos ahora otro más interesante.

Supón que tenemos tres ~~contextos~~ situaciones completamente diferentes:

una lista de números.
un único número pero que quizás esté o no definido (el típico "opcional").
un teletipo por el que un usuario introduce números.

Para cada situación, debemos implementar un proceso que sume 2 a los números involucrados. Es decir, el contexto con la lista de números se convertirá en un contexto con los números incrementados en dos unidades, el contexto que quizás tiene o no un número se verá incrementado o no en dos unidades y los números que el usuario introduce por el teletipo se verán incrementados en dos.


suma2_lista :: Lista Número -> Lista Número
suma2_lista lista = ...

suma2_quizás :: Quizás Número -> Quizás Número
suma2_quizás quizás = ...

suma2_teletipo :: Teletipo Número -> Teletipo Número
suma2_teletipo teletipo = ...

¿Cómo implementarías los tres procesos que te han solicitado?, ¿qué diferencias hay entre unos y otros?.

Al contrario de lo que ocurría con dormir la siesta en que una acción sí podía realizarse en un contexto pero no en otros, aquí es precisamente el mismo proceso el que puede efectuarse en cualquiera de los tres procesos pero, ¿cual es entonces el contexto sobre el que definiremos nuestro proceso?, ¿qué nombre tiene o como se define un contexto que a la vez sea una lista, un quizás y un teletipo?. Veámoslo:


suma2 :: Mónada m => m Número -> m Número
suma2 cosa_que_devuelve_números = ...

En lugar de concretar ~~la mónada~~ el contexto sobre el que sumaremos, decimos que "nos sirve cualquier ~~mónada~~ cosa que devuelva números". Ahora, las tres funciones anteriores son exactamente la nueva función suma2 y realmente no las necesitamos porque los tres procesos solicitados son:


> suma2 [1..5]
[3,4,5,6,7]
> suma2 (Just 10)
Just 12
> suma2 Nothing
Nothing
> suma2 (putStr "Número: " >> readLn)
Número: 34
36

Procesos sobre las mónadas

Ahora ya podemos empezar a definir un poco mejor ésto de las mónadas y para ello, únicamente necesitamos introducir dos símbolos:

el símbolo que, dado un contexto, me devuelve algo. Por ejemplo si estoy en el coche, quiero obtener la velocidad actual, entonces tendrá que haber una función como dameVelocidad que en algún sitio (digamos variable) me entregue esa velocidad.
el símbolo con el que devuelvo el resultado de mi definición. Por ejemplo si estoy pasando la velocidad de kilómetros/hora a millas/hora, tras hacer la conversión tendré que devolver el resultado.

Veamos los símbolos con un ejemplo:


-- Ésta nos la dan de serie con el coche
velocidadEnKilómetrosHora :: DeLoreanDMC12 KilómetrosHora

-- Queremos convertir de Kilómetros a Millas
velocidadEnMillasHora :: DeLoreanDMC12 MillasHora
velocidadEnMillasHora = do
                            kmh <- velocidadEnKilómetrosHora
                            return ( kmh / 1.609344 )

Y ya está, ya sabes usar las tan complicadas y difíciles mónadas.

Tejiendo con mónadas

Creo que resultará interesante contrastar las funciones suma2 y velocidadEnKilómetrosHora e implementar ambas. ¿Porqué en suma2 aparece la mónada dos veces (como argumento de entrada y como argumento de salida) y en velocidadEnKilómetrosHora sólo de salida?.

La razón es que en suma2 tomamos algo con números y devolvemos otro algo diferente con números diferentes mientras que velocidadEnKilómetrosHora es el mismo coche el que nos devuelve la velocidad (no hay dos coches). Veamos si comparando las definiciones se ve mejor:


-- Dada cualquier mónada que devuelve números, podemos sumar 2 a cada uno de esos números
suma2 :: Mónada m => m Número -> m Número
suma2 algo_que_devuelve_números = do
                                     x <- algo_que_devuelve_números
                                     return (x + 2)

-- La velocidad está en el coche, no necesitamos ningún argumento de entrada
velocidadEnKilómetrosHora :: DeLoreanDMC12 KilómetrosHora
velocidadEnKilómetrosHora = do
                               km <- distanciaRecorridaEnLosÚltimos (5 :: Segundos)
                               return (3600 * km / 5)

¿A donde ha ido la pureza?

Alguien puede pensar que velocidadEnKilómetrosHora no es una función pura, porque aparentemente devuelve un valor sin ningún argumento de entrada. Ésto no es así.

Lo que devuelve la función velocidadEnKilómetrosHora es en realidad una función de la forma \datos_coche -> .... Como devuelve una función, no requiere ningún argumento de entrada. Quizás te resulten familiares los términos deferred o promise en que una computación se realizará cuando cierto valor esté disponible. En este caso la función velocidadEnKilómetrosHora define una computación que promete devolver la velocidad del coche cuando esté disponible. El mecanismo usado en diversas mónadas es sencillo, pero los detalles requieren sentirse cómodo usando las mónadas.

Conclusión

Obviamente no hemos introducido los ingredientes necesarios para poder trabajar con mónadas en ningún lenguaje, no es el objetivo. Pero hemos dado una aproximación sobre lo que definen y cómo se opera "dentro" de ellas. Utilizar las mónadas no es más difícil que usar otros mecanismos que nos encontramos en los lenguajes de programación, pero al sernos extraños, debemos hacer un esfuerzo por no "cerrarnos en banda" y ser pacientes a que los nuevos conceptos vayan posándose en nuestro cerebro. Sólo la práctica nos permitirá percibir y poder enjuiciar adecuadamente las ventajas e inconvenientes de cada enfoque, en este caso el uso de mónadas para definir procesos que se ejecutan en cierto contexto.

Extra

Una mónada no es una lista de cosas, no es un opcional, no es un teletipo, no es una promesa, no es algo que contenga cosas ni es aquello que puede invocarse. Si eres capaz de ver que una mónada es tan sólo la concatenación de esos procesos ("promesas") que podemos definir sobre ciertos contextos, al fin y al cabo, quizás sí comprendes que una mónada ¡tan sólo es un monoide en la categoría de endofunctores!

Sobre la pureza de las funciones, ¿están realmente desacoplados los sistema tal como idealizamos?

Jose Juan — Tue, 21 Jun 2016 14:21:52 +0000

Salvo en ~~programas~~ funciones sencillas, estar seguro, comprender las interrelaciones entre las partes resulta muy complicado. Idealizamos nuestros sistemas y pensamos que están desacoplados pero realmente éstos son porosos y con frecuencia los efectos fluyen entre ellos sin que nos demos cuenta... hasta que es tarde. Esta porosidad puede resultar en una interrelación no deseada (un bug) o en un enraizamiento en que el desacople ha desaparecido. Existen muchas técnicas que pretenden mantener el aislamiento pero la mayoría son patrones o guías cuyo única garantía reside en la entereza del equipo de desarrollo para seguirlas. Existen sin embargo, lenguajes que garantizan firmemente el aislamiento de las partes, con sus ventajas y sus inconvenientes.

Funciones puras, funciones impuras

Una función, o es pura, o es impura. Y es pura cuando cumple las dos siguientes condiciones:

independientemente de la situación cambiante del Universo, si se le entregan los mismos valores en sus parámetros devolverá, exactamente y siempre, el mismo valor resultante.
cuando es invocada, la función no produce absolutamente (e idealmente) ningún efecto en la situación del Universo.

Lo primero significa que el comportamiento de la función no depende en absoluto de cualquier valor, configuración, parametrización, estado, ... exterior a la propia función y sus parámetros explícitos de entrada.

Lo segundo significa que el único efecto detectable sobre dicha función es el valor que devuelva como resultado, la función no realizará ni interactuará en absoluto con el "exterior". La puntualización de "idealmente" ha sido añadida únicamente porque vivimos en un mundo físico en el que realizar cualquier operación (ej. 3 + 7) requiere energía, tiempo de procesamiento de alguna CPU, etc...

Una función impura podría ser:


// invoca al Universo para obtener un estado aleatorio
int aleatorio_con_paridad(int paridad) {
    return rand() & paridad;
}

Otra pura podría ser:


// obtiene el valor máximo desde una posición de memoria hasta centinela
int maximo(int *x) {
    int m = *x;
    while(*++x) if(*x > m) m = *x;
    return m;
}

¿Seguiría siendo la función pura si las posiciones de memoria involucradas cambian caprichosa y constantemente sus valores?, ¿es el puntero el argumento o es el conjunto de valores?.

Implicaciones de la pureza de una función

Obviamente existen funciones impuras muchísimo más simples y fáciles de comprender que otras puras pero, en general, en una función pura será mucho más fácil comprender las interacciones con otras partes, básicamente porque sólo con ver su firma, somos capaces de percibir todo el alcance posible de dicha función, mientras que en una función impura nunca podemos asegurar que existan relaciones ocultas.

Podría poner ejemplos sencillos como que una función pura nunca nos sorprenderá llenándonos el disco de entradas de log, que siempre será thread-safe, que puede ser memoizada, etc... sí, con sólo saber que una función es pura podemos, sin mayor información, asegurar todo lo anterior. Pero en la práctica no es tan sencillo.

Para mí las implicaciones prácticas de la pureza de una función son:

en funciones "sencillas" (ej. algoritmos completos como Floyd–Warshall, clustering, ...), la seguridad total de todo lo comentado anteriormente: sin efectos, paralelizable, distribuíble, memoizable, auto-testeable, ...
en ~~funciones~~ programas complejos, la seguridad total de que el contexto de ejecución, aunque potencialmente complejo, es conocido, pues está perfectamente acotado por la firma de la función.

Por ejemplo, si tienes un sistema de facturación, con diversos archivos de configuración, accesos a bases de datos, direcciones de servicios web, etc... podrías tener una ~~función~~ tarea como:


consolidarInventario :: FacturaSis Bool
consolidarInventario = ...

Aunque la pureza de nuestra función ha quedado diluida en la ingente cantidad de cosas que se puede hacer dentro de nuestra biblioteca FacturaSis, sigue siendo pura y si nosotros conocemos bien nuestro sistema FacturaSis nada de lo que haya podido codificar cualquier programador dentro de esa tarea escapa a mi conocimiento. Sí, quizás lo haya codificado mal y al fin y al cabo dicha tarea borre todos los datos ¡pero soy consciente de ello!. Podríamos perfectamente añadir una limitación como


consolidarInventario :: FacturaSis ReadOnly ConsolidaciónDeInventario
consolidarInventario = ...

Y ahora estoy seguro que ese código, haga lo que haga, no tendrá ningún efecto sobre, por ejemplo, el estado persistente.

Otros ejemplos más sencillos de cómo la pureza de una función nos permite conocer propiedades que, de ser impura no podríamos son:


miConstante :: Num a => a

Una función con la firma de miConstante únicamente puede generar un valor que siempre será el mismo y en la que toda la información necesaria para generarlo está codificada en el propio cuerpo. No hay ninguna otra posibilidad. Por ejemplo:


pi :: Floating a => a
pi = sqrt 12 * sum [(-3)**(-k) / (2*k+1) | k <- fromIntegral <$> [0..100]]

Otro ejemplo sencillo de cómo puede deducirse sin lugar a dudas el comportamiento de una función sólo con la firma es:


const :: a -> b -> a
const u v = ...

La función anterior no puede hacer nada con el parámetro v y tampoco tiene información de cómo construir datos del tipo a, por lo que lo único que puede hacer esa función es devolver el valor de u.

¿Cómo puede ser útil un lenguaje que sólo admita funciones puras?

Si una función es pura, significa que no puede interactuar con el mundo exterior, ¿cómo entonces las funciones puras solicitan y muestran datos a los usuarios?.

Si recuerdas el ejemplo de la función máximo anterior, ¿sigue siendo pura aunque las posiciones de memoria que accesa cambien caprichosamente?, la respuesta es que sí, de forma similar, piensa en la siguiente función pura:


teletipo :: String -> String
teletipo entrada = ... salida ...

Si nuestra función teletipo procesa toda la cadena de entrada para generar la salida, entonces no hay interacción posible con el usuario pero, ¿y si nuestra función va generando la salida a medida que va consumiendo la entrada?. En lenguajes como Python, C#, Clojure, ... podemos usar secuencias perezosas, entonces podrías pensar en la función teletipo como


teletipo :: LazyStringSequence -> LazyStringSequence
teletipo entrada = ... salida ...

En que el usuario ahora puede escribir parte de la entrada e ir leyendo la salida, cerrando el "bucle interactivo" que buscábamos ¡y teletipo sigue siendo pura!.

Funciones puras en la práctica

Las propiedades que poseen las funciones puras aportan un conocimiento y seguridad mucho mayor que si no lo fueran, además, permiten al compilador o recolector de memoria deducir comportamientos que en otros lenguajes no es posible (por ejemplo en Android, un objeto puede ser liberado de la memoria ¡cuando se espera una llamada después que realice una acción!), por contra, introducir efectos y acoplar comportamientos entre las partes se hace más difícil, seguramente porque el nivel de abstracción requerido para conseguirlo está más alejado de nuestra intuición, o quizás, porque somos perezosos y preferimos no tener las ataduras que impone una función pura y poder escribir, en cualquier lugar:


....
printf("Hello World!\n");
....

Algo pasa con Haskell

Jose Juan — Thu, 09 Jun 2016 19:43:50 +0000

Sin duda existe una gran cantidad de lenguajes de programación sobre los que podemos poner nuestra mirada. Sin embargo, sólo unos pocos están llamados para la gloria. Existen muchas cuestiones por las que un lenguaje debe ser elegido sobre otros, e igualmente, existen muchas situaciones diferentes que aconsejan usar unos y no otros.

Como lenguaje de propósito general que tenga una comunidad de usuarios con cierta relevancia, Haskell es de los pocos lenguajes que posee características que divergen enormemente del resto de lenguajes. En las siguientes líneas, intentaré dar mi propia y subjetiva visión del panorama actual del ecosistema Haskell, siempre desde un punto de vista práctico y pragmático, y de paso, dar unas pinceladas sobre lo que yo he podido entrever es, la programación funcional.

¿Haskell?

Haskell es un lenguaje de programación del que yo destacaría las siguientes características:

Es perezoso: por defecto, cualquier expresión (dentro de una definición) no es evaluada hasta que su valor es requerido. Este concepto tan simple tiene unas implicaciones enormes y realmente sorprendentes. En la práctica, éste hecho resulta en la recomendación de que el programador piense en términos de computaciones en lugar de código, de forma que quede nítidamente claro que al definir la lista [3 * 4, 6 * 5, 1 + 2] no tenemos la lista [12, 30, 3], sino tres expresiones que podrán o no estar evaluadas cuando su valor se requiera. No te dejes engañar por la simplicidad de este mecanismo y no pierdas la oportunidad de conocer intrigantes formas de sacarle partido.
Mantiene la transparencia referencial: cualquier expresión en Haskell cumple la transparencia referencial es decir, dada una expresión, por compleja que sea, siempre podrá ser sustituida por su valor al evaluarla. Lo anterior es equivalente a decir que cualquier expresión en Haskell siempre siempre devolverá exactamente el mismo valor y que por tanto, no está permitida no existe ninguna función que, por ejemplo, devuelva un número aleatorio o lea de disco puesto que estas dos operaciones pueden devolver valores diferentes cada vez que son evaluadas. Otra vez, puede que te resulte simple e incluso limitado, pero de nuevo esta característica te permite manipular estructuras con un nivel de abstracción sorprendente.
El sistema de tipos: Haskell implementa un sistema de tipos basado en el polimorfismo Hindley-Milner ampliado con un sistema de clases de tipos (Type classes) que no tiene nada que ver con las clases de la POO. Al contrario que las dos características anteriores, sencillas de entender pero con enormes implicaciones, el sistema de tipos de Haskell ni es sencillo, ni sus implicaciones son tan trascendentales (¡siéndolo!). Aun así es tal que, una vez te acostumbras a él, lo echas de menos en el resto de lenguajes. Creo que es el sistema de tipos el que da cohesión a las dos anteriores y juntas las tres, marcan una diferencia radical frente a otros lenguajes que "admiten evaluación perezosa" y "admiten transparencia referencial".

Desde un punto de vista emotivo, Haskell pudiera ser considerado como el abanderado de los lenguajes que nos prometía la serie de artículos Programación imperativa VS declarativa en su variante funcional, pero desde un punto de vista práctico, veremos en las próximas líneas que el diablo está en los detalles.

Aprendiendo Haskell

Comentan los profesores que el aprendizaje de Haskell es más suave en aquellos alumnos que nunca antes hayan tenido contacto con lenguajes de programación,

en el sentido de que los segundos adquieren "las malas costumbres y pensamientos impuros" de los lenguajes imperativos (permíteme que insista con la serie Programación imperativa VS declarativa si deseas profundizar en el tema).

Yo nunca he enseñado Haskell a nadie, por lo que sólo puedo hablar por mi mismo, pero efectivamente, cuando hace unos 4 años andaba yo hastiado de la indefectible monotonía de los lenguajes, en mi búsqueda del Santo Grial me topé con Haskell. Una disrupción mental sacudió mi cerebro y fue el reto, la dificultad, la curiosidad que me hizo elegir a éste sobre otros lenguajes candidatos (Scala, Clojure y F# en particular).

Sí, dicen que la curva de aprendizaje es más acusada en Haskell que en otros lenguajes y en mi caso así ha sido (deliciosamente acusada), pero también es cierto que, ¿no es razonable que así sea si ya tenemos deformado nuestro cerebro con estrategias imperativas?.

Ha llovido mucho desde que dejé la Universidad, pero en ellas nunca oí hablar de Haskell y tan sólo los venerables Lisp y Prolog entraban a hurtadillas en el plan de estudios. Afortunadamente parece que eso ha ido cambiando desde entonces y son varias las universidades y docentes (del que me gustaría destacar a José A. Alonso del Dpto. de Ciencias de la Computación e Inteligencia Artificial de la Universidad de Sevilla) que realizan un esfuerzo para mantener viva la plasticidad de las mentes de sus alumnos.

No te quiero engañar, a mi me resultó (y resulta) difícil, pero eso es precisamente lo que me divierte y motiva.

Haskell en las trincheras

Muchos programadores tienen lenguajes fetiche, lenguajes de los que disfrutan, pero que no los usan de forma profesional. Con frecuencia Haskell es uno de ellos.

Una vez has remontado la hercúlea pendiente y te sientes cómodo entre mónadas y functores, sería temerario usarlo profesionalmente sin antes hacerse la pregunta de si Haskell es un lenguaje útil, práctico para desarrollar nuestras soluciones.

Recientemente Gabriel Gonzalez pormenorizó el State of Haskell ecosystem de las que destacaré las que, siempre en mi opinión, son las más relevantes:

IDE support: a mi siempre me han gustado los IDE, desde el vetusto Turbo C de Borland, siempre he sabido apreciar las comodidades que un buen IDE suministra. Haskell adolece de una solución que pueda satisfacer, sobre todo, a aquellos que se inician en el lenguaje. Particularmente utilizo vim, porque me permite trabajar cómodamente de forma remota, emacs podría ser la alternativa adecuada y está Leksah programado en Haskell pero que no termina de enganchar. No, en mi opinión no hay una solución adecuada y debes tunearte por tu cuenta un entorno de trabajo que te resulte cómodo.
Standalone GUI applications: si te planteas desarrollar este tipo de aplicaciones, el problema se agudiza y deberías analizar bien la arquitectura a utilizar si tu aplicación tendrá un tamaño considerable.
ARM processor support: Haskell tiene soporte para Windows y Linux sobre x86_64 e i686 pero adolece de formas robustas de desarrollar para otras plataformas (en particular para Android e iOS). Si bien es cierto que es posible distribuir para todas ellas (incluidas Raspberry y Arduino).

Realmente ninguna de las anteriores tiene una gran relevancia, pero sí es cierto que sobre todo para front-end parece recomendable que si nuestro sistema va a tener un tamaño apreciable, usemos entornos con un tooling más productivo.

Mi propia conclusión es que hoy en día Haskell es una fantástica opción si tu equipo de desarrollo está capacitado y lo usas para la parte de negocio. El despliegue es trivial (más allá de tu propia arquitectura), las dependencias nulas y consumos de recursos de servidor muy ajustados.

¿Es Haskell el futuro?

Tristemente y en mi opinión, no. No creo que se vuelva mainstream a corto o medio plazo, aunque también creo que siempre será una opción apreciada y usada por muchos desarrolladores y empresas. Este hecho es un condicionante muy importante para muchos, dado que limita la cantidad de soporte y tooling respecto de otras soluciones, aun cuando proporcionalmente, en mi opinión, está notablemente por encima de otras. Por desgracia el contexto actual hace que, popularmente, las cosas negativas de Haskell tengan más peso que las positivas.

En todo caso y sin dudarlo, sea por curiosidad, porque te gustan los retos (Functional pearls) o sencillamente para tener una visión mejor de lo que significa ser programador, te recomiendo que ¡aprendas Haskell por el bien de todos!.

Fragilidad del software ¿En qué estoy fallando?

Jose Juan — Fri, 03 Jun 2016 07:16:05 +0000

Supón que sigues todas las guías de estilo, eres "clean", cuidadoso, fiel seguidor de TDD, conoces tu plataforma, ... pero, aun así, por una extraña razón, con el tiempo tu sistema se tambalea, o debes perder mucho tiempo en refactorizar, o el número de tests hace que tus despliegues demoren horas, o cada vez te resulta más confuso ver la mejor forma de introducir mejoras, ... ¿qué ha fallado?

No estoy hablando de cuando se hacen las cosas mal (en que es más o menos obvio que tarde o temprano se pierda el control), estoy hablando de cuando las cosas se hacen bien o, al menos, se han seguido los cánones marcados por la industria. No es infrecuente perder el control de un proyecto y ocurre en una gran variedad de ámbitos, equipos grandes o pequeños, en grandes y pequeñas empresas, con recursos y sin recursos.

¿Qué es la fragilidad del software?

La fragilidad del software representa una propiedad global de un sistema (de software), pero no de lo bien o mal que funciona, sino de la capacidad del mismo para adaptarse a algún cambio. Así, un sistema puede ser muy robusto, tolerante a fallos, rápido, ... y, aun así, ser tremendamente frágil. Si cuando de un sistema que funciona bien (razonablemente, bien o muy bien) se dice "mejor no tocarlo", es porque ese sistema es frágil.

La fragilidad del software da idea de la capacidad de un sistema de software para adaptarse a algún cambio

Si definir la fragilidad del software resulta bastante sencillo (tolerancia al cambio), determinar y/o identificar sus causas resulta tremendamente complicado ya que existen innumerables razones por las que un sistema se vuelve frágil, pero además, dichas razones están con frecuencia interrelacionadas (enrevesadas mas bien) de modo que, por ejemplo, alguien podría pensar que un sistema es más frágil cuanto más tiempo transcurre sin mantenimiento (por ejemplo, porque la plataforma de desarrollo evoluciona y debe guardarse, recuperarse o reinstalarse una versión acorde a dicho sistema), pero no es menos cierto el recíproco, que un sistema es más frágil cuanto más modificaciones sufre (por ejemplo, si no mantenemos la probabilidad de detectar y corregir por encima de la de introducir errores, los errores, sólo pueden aumentar con el tiempo).

Por el ejemplo primero queda claro que no es suficiente con "no tocar nada" para que no aumente la fragilidad de nuestro software (¡aumentará aunque no modifiquemos nada!) y por el segundo que la fragilidad aumentará o disminuirá de acuerdo a un complicadísimo juego de malabares entre una aparente infinidad de factores interrelacionados (enrevesados).

no es suficiente con "no tocar nada" para que no aumente la fragilidad de nuestro software

¿En qué me afecta la fragilidad del software?

En primer lugar decir que, el que no te sientas afectado (no percibas síntomas de fragilidad en tus softwares) ya es un síntoma de que (quizás) estés ignorando la fragilidad del software, en el sentido de que puedas estar derrochando recursos (muy probablemente), no obstante, es sin duda el mejor punto del que partir (siempre que ese derroche sea asumible).

Sin embargo en general (con excepciones por supuesto) y en todo tipo de países y empresas (ojo, en mi subjetiva experiencia), los sistemas frágiles están a la orden del día, y existe una clara intención (que sea consciente o inconsciente lo desconozco) de mantener un equilibrio entre los costes y la fragilidad del sistema de tal forma que el patrón habitual suele ser rentabilizar el sistema al máximo y por tanto, asumiendo muchos inconvenientes que no son populares (a.k.a son vergonzantes) en el mundillo. Decidir si es un acierto o una equivocación a mí me parece que es mucho más difícil de lo que parece, porque aunque seguro que todos tenemos en mente proyectos que han sido un desastre, lo cierto es que esas empresas funcionan y ganan mucho dinero con esos sistemas tan frágiles. Si les afecta, no lo parece mucho.

esas empresas funcionan y ganan mucho dinero con esos sistemas tan frágiles

Por otro lado, también hemos comentado que aunque un sistema no se modifique (no sólo el codebase, me refiero a todo el sistema, incluyendo hardware, personal, etc...), la fragilidad aumenta, aunque en dicho caso, no se sufre (manifiesta) dicha fragilidad. Un ejemplo podrían ser los videojuegos, la gran mayoría de los juegos poseen una fragilidad "latente" bastante elevada (no tan grande como cabría esperar porque suelen ser "cajas negras", compárese dicha fragilidad con aquellos que requieren un servidor para funcionar...) pero el mecanismo de la emulación, permite congelar ese estado y la fragilidad de todos los juegos emulados pasa a ser la que tenga el emulador.

Por tanto, que la fragilidad exista en mayor o menor medida no parece ser tan relevante como que tenga un efecto real sobre nuestros objetivos. ¿No estaría bien poder determinar o regular en qué medida me va a afectar la fragilidad de mi sistema?.

¿Qué hace frágil un sistema?

Que yo sepa, nadie lo sabe, es decir, está claro que proviene de infinidad de factores interrelacionados y trivialmente podríamos enumerar una gran cantidad de ellos, también podemos enumerar cuestiones que nos parecen obvias (muchas de las cuales son ampliamente discutidas, tan obvias no serán...), pero no hay un modelo matemático (sí algunas métricas) que describa la evolución de la fragilidad de un sistema y por tanto que nos permita hacer predicciones, como se hace con el tiempo meteorológico, y actuar anticipadamente y/o de forma inteligente (preventiva).

De todos modos, podemos enumerar algunos muy muy generales que engloban otros muchos particulares:

fallos de software: básicamente "corner cases" cruzados entre múltiples piezas de software que a posteriori son difíciles de identificar o, aunque son identificados, son difíciles de aplicar una solución global (por las interacciones producidas).
fallos en la arquitectura: básicamente incoherencias en el/los modelo/s utilizados a lo largo del tiempo, normalmente introducidos por desconocimiento (ej. pensar que el cliente conoce las interrelaciones de su negocio) o bien de forma consciente por imposibilidad de definir un modelo mejor, ésto tiene (al menos) dos causas no excluyentes, la falta de recursos y/o la impredictibilidad (que no es exactamente desconocimiento).
fallos en el proceso: aquí estarían todas las técnicas englobadas por el término "buenas prácticas": clean code, documentación, patrones, testing, ...
fallos de hardware: el software requiere un hardware para funcionar (un emulador al final corre en un hardware) y no siempre es fácil emular todo el contexto que requiere el software (por ejemplo, ya hemos comparado la fragilidad de los juegos "caja negra" y aquellos que requieren un servidor para funcionar).
fallos de personal: no sólo de aquellas implicadas directamente en el sistema, aun cuando la "caja negra" que describe nuestro software no sufra ningún tipo de modificación, la fragilidad puede provenir del uso que terceras personas hacen de él (en el boom de las .com [en España ya en este milenio] se percibió claramente, pues las páginas web "viejas" asumían un internauta "friki" pero cada vez más internautas "normales" accedían a la red requiriendo un replanteamiento de las mismas, todo ello derivó en libros como "No me hagas pensar" de Steve Krug).

Fragilidad del software y la entropía

Si estás al tanto de la segunda ley de la termodinámica, te habrás fijado que la evolución de un sistema software y la evolución de su fragilidad tiene mucho que ver con la entropía de un sistema. Lehman indica que cuando se modifica un software, su complejidad siempre crece, pero yo (osado de mi) no estoy de acuerdo pues nuestro sistema software no está cerrado y de la misma forma que nuestra entropía decrece con nuestro ciclo vital (comer y ...; véase El camino a la realidad de Roger Penrose) podemos reducir la entropía de nuestro software a costa de aumentar (por ejemplo) la nuestra propia.

Una demostración (por fuerza informal) es que partiendo de un código vacío, podemos recorrer el ínfinito grafo de ediciones que podemos hacer sobre el mismo (por ejemplo, "v", "vo", "voi", "void" "voidm", "voidma", "voidm", "void", "void ", "void m", "void ma", "void mai", "void main", ...) y por tanto es obvio que podemos movernos a voluntad por todo el grafo, donde cada uno de los nodos corresponde a un estado de nuestro codebase (unos compilarán y otros no, unos tendrán más fragilidad y otros menos, etc...). Digamos básicamente que podemos reducir (¡o aumentar!) la complejidad (fragilidad y entropía) de nuestro software tirándola por el retrete...

Este resultado era obvio, cuanto más recursos dediquemos, más probable será (¡que no seguro!) que la fragilidad de nuestro sistema se reduzca (moviéndonos por el grafo de estados de nuestro código), la cuestión es ¿cuales son los recursos mínimos necesarios y cómo usarlos para que la fragilidad de mis sistemas estén dentro de cierto margen?.

¿Cuáles son los recursos mínimos necesarios y cómo usarlos para que la fragilidad de mis sistemas estén dentro de cierto margen?

¿Cómo minimizar la fragilidad de mi sistema?

Yo no lo se. La respuesta fácil es enumerar términos como clean, TDD, KISS, patrones, microservicios, ... pero son sólo técnicas, manifiestos, guías, ... basados en la experiencia y que pueden o no encajar con nuestro contexto particular. Obviamente usar buenas prácticas parece adecuado, pero no hay que olvidar que una buena práctica mal usada se convierte rápidamente en una pésima práctica y, además, ya hemos visto que dichas prácticas son sólo una parte, no hace mucho Google se preguntaba porqué algunos equipos de trabajo funcionan y otros no (otro factor que tiene visos de afectar a la fragilidad del producto).

Una buena práctica mal usada se convierte rápidamente en una pésima práctica

Parece entonces que hay "algo" por encima de esas prácticas que debería poder hacerse de las cuales yo veo dos sobre otras (que habrá, que yo desconozco y que puede sean más relevantes): la experiencia y sentido común de quien aplica las soluciones, pues es dicha experiencia la que sabe seleccionar las técnicas (ej. herramientas, normativa, arquitectura, ...) más adecuadas para el caso (y ésto es algo que no puede transmitirse fácilmente de unas personas a otras; los términos enumerados anteriormente apuntan a ello) y algo que sí creo firmemente que ayudaría sustancialmente a contener la fragilidad de nuestros sistemas son los estándares (porque definen autopistas sobre las que no hay margen de elección y pueden aprenderse muy fácilmente) que a nadie parece importarles demasiado o quizás nadie consigue definir buenos estándares para nuestros problemas pero, si lo piensas, son los estándares fijados hace décadas las partes de nuestros sistema que siempre funcionan y de las que ni siquiera nos fijamos (por asumidas) cuando ponemos los dedos en nuestros teclados.

Selección aleatoria ponderada y las cadenas de Markov

Jose Juan — Thu, 29 Jan 2015 15:47:55 +0000

Supón que te piden construir un sitio web en el que los usuarios puedan escribir poemas y, a su vez, valorar los poemas que escriben otros usuarios.

Para incentivar que los usuarios lean y valoren los poemas de otros usuarios, la probabilidad de que un poema suyo sea seleccionado (para ser valorado por otro usuario) debe ser proporcional al número de votos que éste ha emitido. Así, aquellos que más se esfuerzan en leer y valorar a otros, serán también más leídos y valorados.

Teniendo en cuenta que hay millones de poetas, que cada poeta escribe un poema al día (en un año habrá 365 millones de poemas) y que cada poeta lee y valora 10 poemas al día (en un año habrá 3.650 millones de votos). ¿Cómo seleccionar aleatoriamente un poema?.

Solución inmediata, escaneando la lista de usuarios

Una solución tremendamente sencilla, consiste en tomar la lista del número de votos de los usuarios e ir acumulándola desde el primer elemento hasta el último:

UsuarioId	VotosEmitidos	AcumuladoDeVotosEmitidos
48517	85	85
13782	77	162
58184	79	241
47596	22	263
82126	89	352
21258	69	421
31316	58	479
64711	20	499
62975	68	567
84333	84	651

Con dicha lista, basta buscar un número aleatorio entre 0 y el total de votos y buscar el registro con el menor acumulado que lo contenga (ej. con una busqueda dicotómica).

El método es factible en la práctica, siempre que se permita calcular la tabla de acumulados cada "mucho" tiempo (por ejemplo, una vez al día), puesto que calcular la tabla de acumulados requiere un coste lineal respecto del número de filas (y vamos a tener millones con millones de peticiones cada día).

Por supuesto puede hacerse muy eficiente, por ejemplo podría mantenerse dicha tabla en memoria (aun con millones de usuarios no ocuparía más de unos pocos megabytes), actualizándose asíncronamente cada vez que un usuario emite un voto (requiere dos accesos indizados e incrementar la mitad de los acumulados de la tabla, lo cual llevará apenas algún milisegundo o menos). Así, el servicio estaría centralizado (con el consiguiente peligro de sobrecarga) pero las probabilidades resultantes se ajustarían enormemente a los requerimientos solicitados.

Para evitar una sobrecarga, la actualización puede hacerse en un buffer independiente de la tabla de lecturas (no bloqueantes) y mantener un pool de "entradas de votos" para hacer de forma simultánea la actualización de tramas de entradas de votos (las que han ido entrando mientras se recalculaba la actualización anterior).

Nota: el conteo de votos de cada poeta no es necesario recalcularlo si tenemos cuidado de incrementar un contador por usuario cada vez que alguien le emite un voto. Típicamente sería hacer un "update Usuario set TotalVotos = TotalVotos + Delta ..." cuando se inserta un voto ("Delta=1") o elimina un voto ("Delta=-1") posiblemente en sus respectivos triggers.

Escalable y distribuible

La solución anterior es práctica y muy sencilla de implementar. Parece razonable que se nos permita calcular offline una vez al día el "ranking" de los usuarios y usarlo sin modificar hasta el día siguiente. Si la precisión en las probabilidades es muy importante como para que esté actualizada constantemente (los poetas no parecen muy quisquillosos, pero nunca se sabe) o nuestro sistema siempre debe estar online (por lo que no podemos hacer un bloqueo global para calcular los acumulados), podemos implementar la versión complicada que requiere de un servicio específico (en línea y en memoria). Aun cuando cada habitante del planeta Tierra abriera cuenta en nuestro servicio, "sólo" necesitaríamos 260G RAM (7e9 humanos * 8 bytes * 5 números), 521G si usamos doble buffer.

Pero lo interesante es ¿podría hacerse sin mantener ninguna estructura o servicio adicional que no requiera considerar todos los usuarios?, ¿puede hacerse eficiente aunque el número de usuarios aumente indiscriminadamente? (en cuyo caso, la primera solución dejaría de valer), o, dicho de otra forma, ¿puede hacerse escalable y distribuible? (no deba estar centralizados ni los datos, ni las máquinas que resuelven las peticiones).

Si nos exigen una precisión total en la probabilidad de elegir un poeta u otro no parece posible, pero si nos permiten limitar el número de "rankings" diferentes, es decir, si nos permiten agrupar entre "poetas que no votan", "poetas que votan algo", "poetas que votan de vez en cuando", "poetas que votan con cierta frecuencia", ... entonces, podemos construir un método de selección (un algoritmo) que respete las probabilidades y sin tener que mantener ninguna estructura con coste proporcional al número de usuarios y, lo más interesante, tanto los datos como los servicios pueden estar distribuidos.

¿Como?

Bueno, si los poetas con más votos realizados los llamamos A, los siguientes B, ... entonces, está claro que deberán salir más veces los poemas de los A, luego de los B, ... basta entonces elegir uno cualquiera (todos con la misma probabilidad) si sale A entonces hemos terminado, si sale otro volvemos a tomar otro aleatoriamente, si sale A o B, entonces hemos terminado, si sale otro volvemos a tomar otro aleatoriamente, si sale A, B o C...

Por poner un ejemplo muy sencillo, supongamos que el 10% de los N usuarios están en el grupo A por tener el doble de votos que los del grupo B (el otro 90%). Entonces, cada usuario a € A debe tener el doble de probabilidad que cada usuario b € B de ser elegido para que le valoren un poema.

Como a un usuario lo eligen uniformemente de entre todos es P{u € A} = 0.1 y P{u € B} = 0.9.

Y según la estrategia anterior "en escalera" tenemos que hacer:

Donde se ve que la probabilidad final de P{Elegido A} = 0.1 + 0.9 * 0.1 = 0.19 y de P{Elegido B} = 0.9 * 0.9 = 0.81; es decir, si hay 100 usuarios (por poner las probabilidades de cada usuario individualmente) tenemos que P{Elegido cierto x con x € A} = 0.19 / 10 = 0.019 y por otro lado, P{Elegido cierto x con x € B} = 0.81 / 90 = 0.009.

Pues resulta que hemos tenido suerte y con dicho algoritmo para este caso concreto, se cumple que los poetas del grupo A tienen el doble de probabilidad de ser elegidos frente a los del grupo B (como debe ser, puesto que los primeros han realizado el doble de valoraciones que los segundos).

El tema ahora es, ¿qué grafo (autómata) debemos seguir si hay más grupos de usuarios?, ¿cómo podemos hacer que las probabilidades resultantes sean las buscadas?.

Cadenas de Markov

El grafo anterior que presenta un autómata y en el que cada arista posee una probabilidad de ser elegida, representa una Cadena de Markov, las cuales han sido profusamente estudiadas y de las que se conocen muchas propiedades interesantes.

Una cadena de Markov es un simple autómata, en el que no hay ninguna entrada de símbolos, lo que se hace para pasar de un estado al siguiente es elegir las alternativas aleatoriamente (con la distribución de probabilidad que sea).

Por ejemplo, la siguiente cadena de Markov:

(Fuente: Wikipedia)

Genera cadenas de la forma AAAEEAEAAAEAAAAEEAAAAAAEAAAA... sólo hay que seguir el autómata para verlo, es muy sencillo.

Lo que vamos a hacer para terminar de resolver nuestro problema, es crear un autómata generador de cadenas de Markov en el que dejaremos libres ciertas incógnitas, luego las despejaremos y ya tendremos nuestro seleccionador aleatorio de poemas escalable y distribuible.

El mejor autómata

A mí, no se me ocurre cual puede ser el autómata óptimo para cada conjunto de datos de entrada posible (número de grupos, probabilidades, etc...), pero está claro que debemos de poderlo generar según se deseen más o menos grupos de poetas, así, se me ha ocurrido hacer una estrella en el que hay un pétalo para cada grupo de poetas:

Es fácil demostrar que para ciertos conjuntos de datos no existe ningún autómata (ni de flor, ni de fruta ni de ningún tipo) óptimo (no hay solución), o que, también para cualquier autómata, serán necesarios muchos experimentos (obtener un usuario al azar) para obtener la probabilidad buscada (ej. si un usuario de entre un millón debe tener más de un millón de veces probabilidad que el resto ¡hacen falta un millón de lanzamientos en media!). Pero para datos "razonables", obtendremos soluciones "razonables" y, esta flor, permite encontrar siempre unos parámetros de ajuste.

La flor, desde inicio, obtiene un usuario al azar con coste O(1) y obtendrá un usuario de alguno de los grupos. Con cierta probabilidad h desconocida, se lo quedará o descartará, repitiendo el proceso un máximo prefijado de veces, con lo que el coste de la selección, sigue siendo O(1) independientemente del número de usuarios que existan y de cómo estén representados (ordenados, desordenados, en la misma máquina, varias, ...). El único requisito es poder elegirlos aleatoriamente de forma uniforme.

Despejando las H

Dado un conjunto de grupos A, B, C, ... y sus respectivas probabilidades conocidas a, b, c, ... (que no son más que el número de usuarios que contiene cada grupo dividido por el total de usuarios) tenemos una serie de incógnitas h_a, h_b, h_c, ... que harán que, la probabilidad final de alcanzar cada grupo, sean las buscadas, llamemoslas P_a, P_b, P_c, ... (que no son más que la suma de votos de cada grupo partido por el total).

Por otro lado, hemos dicho que el autómata debe terminar en T iteraciones, para que nuestro algoritmo siga teniendo coste constante. Pero partiendo de inicio, T debe ser un número impar de saltos (para estar en un estado "Quizás X" o en un estado "Elige X").

¿Cual será entonces la probabilidad de haber elegido un usuario de cada grupo tras "ir saltando" T veces por nuestra cadena de Markov?.

Cualquier grafo, puede representarse mediante una matriz y las cadenas de Markov no son una excepción, denominándose en este caso matriz de transición. Que no es más que hacer lo mismo que en cualquier otro grafo:

	I	Q.A	E.A	Q.B	E.B	Q.C	E.C	...
I	0	a	0	b	0	c	0	...
Q.A	1-ha	0	ha	0	0	0	0	...
E.A	0	0	1	0	0	0	0	...
Q.B	1-hb	0	0	0	hb	0	0	...
E.B	0	0	0	0	1	0	0	...
...		............

La matriz anterior indica la probabilidad de ir de un estado cualquiera a otro cualquiera, se ve por ejemplo que del nodo "Elige A" no se puede ir al nodo "Inicio" (probabilidad 0) y que del nodo "Quizás A" al nodo "Elige A" hay una probabilidad de ha.

Aunque si no estás acostumbrado a calcular probabilidades de sucesos dependientes te puede costar verlo, la potencia n-ésima de la matriz de transición nos da las probabilidades, de todos los caminos posibles, desde cada nodo a cada nodo. Realmente, ya lo hemos hecho (de forma muy sencilla) en el ejemplo de "Elige u" anterior.

Así, sólo tenemos que hacer M^{T + 1} (el más 1 es porque la primera transición ocurre en el primer producto M²) para obtener las probabilidades finales. Como sólo nos interesan las que salen del nodo inicial, resulta que las tenemos en la primera fila de la matriz resultante de la potencia.

Por último y como hemos limitado a T transiciones, podremos haber terminado en un estado "Quizás X" o bien "Elige X", por lo que las probabilidades buscadas hay que igualarlas a la suma de ambas, es decir:

P_a = P{Quizás A} + P{Elige A}

P_b = P{Quizás B} + P{Elige B}

P_c = P{Quizás C} + P{Elige C}

...

Con este procedimiento, podemos elegir libremente el número de grupos en que clasificamos a los poetas participativos y los no participativos. Además, podemos graduar la precisión que queremos obtener en las probabilidades resultantes, a costa de aumentar (con T) el número máximo de consultas a la base de datos (para buscar un usuario cualquiera aleatoriamente). Más grupos y menos T implica peor precisión en las probabilidades obtenidas, menos grupos y más T implica un mejor ajuste.

¿Cómo resolver las incógnitas?

Hay muchas formas, en general, al elevar a la potencia la matriz M nos aparecerán polinomios de grado superior en muchas variables, por lo que aunque es fácil obtener la expresión simbólica, despejar las variables parece que sólo se podrá hacer numéricamente.

Por ejemplo en Python podría usarse SymPy para elevar la matriz a la potencia y luego despejar numéricamente las incógnitas.

En el siguiente apartado, que no añade nada más a la solución, utilizo una sencilla búsqueda por Montecarlo en el dominio de las h.

Uhm... vale ¿y qué hacemos con las incógnitas?

Con ellas, tenemos perfectamente determinado el autómata no determinista (en este caso la cadena de Markov) con todas las probabilidades conocidas, sólo se trata de evaluarlo y ver en que estado (usuario) termina. Podemos recalcular el autómata en cada petición o mantenerlo cacheado durante X tiempo, además, es independiente (se ha admitido no transaccionalidad en la precisión obtenida) de cualquier otro estado, por lo que diferentes máquinas pueden calcular sus autómatas de forma independiente asegurando la tan ansiada distribuibilidad, escalabilidad y por tanto tolerancia a fallos, siempre online, etc...

Un ejemplo en Haskell

Realmente, todo se reduce a construir la matriz de transición, elevar a la potencia, despejar las incógnitas y evaluar las veces requeridas el autómata no determinista obtenido. Yo me enrollo mucho, pero en unas pocas líneas lo tenemos resuelto.

El siguiente código sirve para obtener las soluciones (las h) para cualquier número de grupos:

(En un entorno real y dado que es un sistema de polinomios seguro que podemos usar un solver mucho mejor; ¡pero éste es cómodo!).

Con él y a modo de "ejemplo de uso", podemos ver cómo obtener con distribución uniforme números naturales que existen con distribución no uniforme (les damos más preferencia a unos números que a otros).

El siguiente código, genera un generador (sí, genera un generador que a su vez genera números con la distribución buscada) de números aleatorios pero de tal forma que la probabilidad de obtener un número divisible por dos, un número divisible por tres (pero no por dos) u otro (no divisible ni por dos ni tres) es la misma (cuando respectivamente las probabilidades son 1/2, 1/6 y 1/3) y eso, sobre "todos" los números naturales (que no admiten la primera estrategia comentada).

El siguiente código compara el generador anterior con el estandar (con el no ajustado), además, utiliza dos valores de T para comparar la bondad de ajuste (precisión) obtenida.

Migración de costes (o el castigo de Sísifo)

Jose Juan — Wed, 25 Jun 2014 10:01:17 +0000

Muchos conoceréis el mito de Sísifo, castigado a empujar una piedra hasta la cima de una montaña, tras lo cual, la piedra volvía a rodar hacia abajo, debiendo repetir el proceso eternamente.

Como el de Sísifo, existe otro mito en el desarrollo de software, que sin ser tan antiguo, es seguro que atormenta a muchos desarrolladores desde hace mucho, mucho tiempo.

Si aún no lo conoces, te recomiendo que te informes sobre "la migración de costes".

En realidad (no puedo asegurarlo) el concepto original de "migración de costes" proviene de las prestidigitaciones que los gurús contables hacen para convercer al personal que cuatro menos tres son seis, o lo que es lo mismo, que no es que las pérdidas alcancen x miles de euros, sino que se han obtenido beneficios por z miles.

Pero, la acepción que me interesa traer a colación, es aquella que básicamente, podría enunciarse así

... la migración de costes, consiste en conseguir que tu trabajo lo haga un pringao ...

Bueno, bueno, podríamos expresarlo de una forma más cool diciendo que realmente "cost migration es un antipatrón de diseño que persigue trasladar los gastos de un proyecto, departamento, socio, cliente, proveedor, ... a otro más vulnerable".

Admitirás conmigo que, salvando eufemismos, mi primera definición es más corta, clara y contundente que la segunda.

No creas que se trata de la consabida y popular estratagema de todo trabajador (sobre todo si es español) de "que lo haga otro".

No, no, no. La migración de costes es mucho más sutil y destructora. Su ámbito de actuación no tiene límites y es muy fácil no darse cuenta que estás bajo la maldición de Sísifo.

Tampoco se trata exactamente de la también archiconocida expresión "el pez grande se come al pequeño", pero es verdad que, sólo en algunos casos, el pez grande migrará costes descaradamente al pez pequeño.

Una migración de costes puede realizarse de forma tan sencilla como un "poyaque" de un cliente, en el que el cliente quiere trasladar el coste que le supone obtener una funcionalidad al hecho de que a ti puede "costarte poco".

Una variante más sutil de la anterior es cuando la otra parte (ej. el cliente) aprovecha un resquicio (ej. una ambigüedad, un "yo creía que", ...) en las especificaciones/trabajo pactadas.

Pero las mas sutiles son aquellas en las que la migración de costes se hace sin que nadie tenga que pedir nada. Nadie te pide que hagas nada que no te corresponde, nadie te pide que hagas nada de más, etc... y aun así, te está migrando costes.

Un ejemplo sencillo podría ser aquel en el que debes implementar la lógica de cierta interfaz de usuario, un compañero ha maquetado el diseño (supongamos HTML) y visualmente se ha ceñido perfectamente al diseño solicitado pero, el marcado, jerarquías, posicionamientos utilizados, identificadores y nombres de clases de estilo, etc... son un auténtico galimatías.

Tú tienes claro que tu compañero no tiene ni idea de maquetar un diseño, y debes ser tú quien invierta unos costes en poner orden al caos anterior.

Similar situación se produce cuando dos empresas quieren interconectar ciertos sistemas (ej. facturación electrónica, inventarios, etc...), si una de las partes tiene un nivel de calidad técnica deficiente, la otra parte deberá equilibrarla aumentando unos costes que no necesitaría cubrir si la otra parte fuera competente.

Por ejemplo, si tú debes conectar contra un servicio y no haces más que tener problemas porque no sabes cómo funciona el protocolo, incumples las indicaciones de la documentación aportada, tienes fallos en los parámetros de configuración, etc... no harás más que "molestar" a la otra parte con tus dudas y problemas siendo la otra parte, la que tiene que dedicar recursos a revisar qué falla y explicártelo (o al revés si el deficiente es el otro).

Si la otra parte es "un pez grande" es muy posible que directamente él no dedique los recursos que sí debería dedicar, para que su sistema ofrezca un nivel de calidad adecuado (buen análisis, estabilidad, documentación, ceñido a estándares, entorno de test, etc...) porque sencillamente, sabe que tú necesitas mucho más que él esa interacción.

Es realmente frecuente, ver "peces grandes" que de puertas para afuera ofrecen una visión de calidad y excelencia, invirtiendo en ello unos costes mayores (marketing, acuerdos comerciales, etc...) al reducirlos de otras estructuras (donde los costes son migrados "al pez pequeño").

En el ejemplo anterior, bien puede ser que "el pez grande" dedique más recursos de desarrollo a la interfaz pública de usuario y menos a los sistemas de integración con terceros, sabiendo que serán éstos (los terceros) los que dedicarán los recursos que sean necesarios para llevar a buen puerto la integración (aunque tengan que lidiar con una documentación obsoleta y llena de ambigüedades e incoherencias, haciendo pruebas sobre un protocolo críptico y sin notificación de errores).

Si aderezamos situaciones como las anteriores con agentes adicionales involucrados en la relación (ej. un cliente, un contractor y dos proveedores tecnológicos ¿quién le está fallando al cliente?, ¿él mismo porque no delega decisiones (al contractor) que él no sabe tomar?, ¿el contractor porque no sabe analizar y especificar sus necesidades?, ¿alguno de los proveedores tecnológicos?, ...) entonces la migración de costes se diluirá sutil y mortalmente en una sopa de vetes y diretes.

Pero, ¿que puede hacerse frente a la migración de costes?.

Obviamente si cada una de las partes hace razonablemente bien su trabajo y respeta el trabajo de los demás, consiguiendo una dinámica de trabajo en equipo, pueden existir ciertas "saludables migraciones de costes" (porque nadie somos perfectos), pero cada una de las partes encontrará más fáciles de resolver sus problemas o, al menos, no más difíciles de lo que resulta el trabajo en sí.

En el ejemplo del compañero maquetador, es posible que necesites migrar unos pocos de tus costes para explicar al compañero la mejor forma de maquetar tal o cual cosa, pero si éste lo aprende y aplica en el futuro, esa "piedra de Sísifo" sólo la habrás tenido que subir una vez.

Desgraciadamente, bien por dejadez, incompetencia, ignorancia o abuso, no es infrecuente que la migración de costes "se vaya de madre" y en esos casos (si puedes), deberías actuar.

Desafortunadamente, no hay fórmulas mágicas (yo al menos no las conozco), sólo la experiencia "y don de gentes" te nutren de las habilidades necesarias para tomar las adecuadas decisiones en cada caso.

Ser cuidadoso en verificar la validez y correctitud de la información que envías a terceros, revisar hasta la saciedad que tus configuraciones son correctas y tus sistemas funcionan como se espera y de forma correcta (ej. emitiendo adecuados mensajes de error allí donde corresponde), que la documentación que suministras es acorde al perfil de a quien va destinada o, en la otra dirección, que si reportas un error indiques información adecuada y completa para poderlo reproducir (o seguir la pista si no es reproducible), que si haces una pregunta estés seguro que no está respondida anteriormente, en alguna documentación o que no forma parte de los estándares y prácticas que deberías conocer, etc... son sólo algunas indicaciones de sentido común (pero que no muchos siguen).

En cuanto al trato personal (don de gentes) la cosa es mucho más complicada, por supuesto lo primero es reconocer sin tapujos cuando detectamos que hemos fallado nosotros, pero por ejemplo, si se trata de un pez grande, muchas veces la estrategia menos mala es "partirte los cuernos" para "molestarle" lo menos posible, hasta el punto, que en lugar de preguntarle cual es el ~~puñetero~~ código que se le ha "olvidado" pasarte, ataques al servicio con miles de llamadas para escanearlo tu mismo (por poner un ejemplo). Si por el contrario no es un pez grande sino "un igual", tener paciencia ante sus errores (notificándoselos de la forma más cordial posible) suele ser suficiente para "que se ponga las pilas", si ésto falla... ¡sácale los colores! (cosa que con el pez grande nunca debe hacerse).

Ni que decir que registrar (y poder recordar y/o recuperar) notificaciones, correos, documentaciones, logs, mensajería de servicios, etc... aun cuando a priori no parezca necesario, son una herramienta vital para no tener que subir, eternamente, la piedra de Sísifo...

Genbeta

Test automáticos con QuickCheck ¿Cómo analizar nuestro código en busca de bugs?

¿Dónde se esconden los bugs?

Quickcheck

Buscando invariantes

Conclusión

Crystal, el sucesor de Ruby

Objetivos de Crystal

Tipado estático e inferencia

El tipo NoReturn

Filtrado de tipos

Macros

Rendimiento

Ecosistema y conclusiones

Aterrizando en la programación funcional

La programación funcional puesta en práctica

Comparativa de algunas estrategias

Automatizando el principio de sustitución de Liskov

Problemas de la programación funcional

To throw or not to throw o para que sirven las excepciones

Acción fantasmal a distancia

El uso de excepciones hoy en día

Excepciones y recursos

Alternativa a throw

Usar mónadas es mucho más fácil de lo que crees, empezando con la programación funcional

¿Qué es una mónada?

¿A qué huelen las mónadas?

¿Para qué sirven las mónadas?

Procesos sobre las mónadas

Tejiendo con mónadas

¿A donde ha ido la pureza?

Conclusión

Extra

Sobre la pureza de las funciones, ¿están realmente desacoplados los sistema tal como idealizamos?

Funciones puras, funciones impuras

Implicaciones de la pureza de una función

¿Cómo puede ser útil un lenguaje que sólo admita funciones puras?

Funciones puras en la práctica

Algo pasa con Haskell

¿Haskell?

Aprendiendo Haskell

Haskell en las trincheras

¿Es Haskell el futuro?

Fragilidad del software ¿En qué estoy fallando?

¿Qué es la fragilidad del software?

¿En qué me afecta la fragilidad del software?

¿Qué hace frágil un sistema?

Fragilidad del software y la entropía

¿Cómo minimizar la fragilidad de mi sistema?

Selección aleatoria ponderada y las cadenas de Markov

Solución inmediata, escaneando la lista de usuarios

Escalable y distribuible

¿Como?

Cadenas de Markov

El mejor autómata

Despejando las H

¿Cómo resolver las incógnitas?

Uhm... vale ¿y qué hacemos con las incógnitas?

Un ejemplo en Haskell

Migración de costes (o el castigo de Sísifo)

El tipo `NoReturn`

Alternativa a `throw`