One liners( 11 ): "desescapando" caracteres html tipo {

dst = re.sub(r'&#([0-9]+);', lambda x:unichr(int(x.group(1))), src)

  • re.sub() hace sustituciones guiada por una expresión regular.
  • r'&#([0-9]+);' es una expresión regular que captura lo que buscamos
    y expone lo que nos interesa, el número
  • lambda x:unichr(int(x.group(1))) es la función (anónima en este caso)
    que decide por que se reemplaza, por el caracter UTF con el código en
    cuestión.
  • src la cadena original
    *

ps: corregido para evitar capturar &#; , perdón :(

untagged

Navegar por TOR y I2P con Firefox de forma transparente » « One liners ( 12 ): trim en bash