"thick underscore" tokens of T5 and MT5 models cause error in CFG #1329

jheinecke · 2024-12-09T16:42:29Z

Describe the issue as clearly as possible:

I use the T5 model and a CFG grammar to guide the ouput. However the tokens in the output contain the token 3 "▁". Since tokenizer.decode([3]) returns an empty chain "" and not "▁" the method iter_valid_token_ids of the class CFGGuide (which checks whether the next token can be accepted with respect to the CFG grammar) sees an empty string (instead of "▁") and rejects the token. In consequence all logits of following tokens are different. In short, using outlines with a very simple grammar which accepts everything, produces a different output than the same model without outlines.

There is a work-around by changing in fsm/guide.py , methode _get_parser_state_token_applied

replace

if new_token_str == "":
            raise ValueError("empty next token")

by

if token_id != 3 and new_token_str == "":
            raise ValueError("empty next token")

For MT5, the "▁" token as the tokenid 259. So for MT5 based models 259 must be used instead of 3.

Steps/code to reproduce the bug:

import readline

from   transformers import T5ForConditionalGeneration, T5Tokenizer
import outlines

tokenizer     = T5Tokenizer.from_pretrained("t5-small")
model         = T5ForConditionalGeneration.from_pretrained("t5-small")
model.eval()

# this grammar accepts everything
cfg_grammar = """
start: NODE+

NODE: /./
"""

olmodel = outlines.models.Transformers(model, tokenizer)
olgenerator = outlines.generate.cfg(olmodel, cfg_grammar)

def test(sentence):
    inputs = tokenizer(sentence, return_tensors="pt").input_ids
    print("inputs", inputs)
    outs = model.generate(inputs) 
    print(outs)
    for ids in outs:
        print (tokenizer.decode(ids, skip_special_tokens=True))
        for tokid in ids:
            print (tokid, "<%s>" % tokenizer.decode([tokid], skip_special_tokens=True), sep="\t")

    outs = olgenerator(sentence)
    print(outs)


t = "translate English to French: The cat has eaten the mouse"
test(t)

Expected result:

inputs tensor([[13959,  1566,    12,  2379,    10,    37,  1712,    65, 16929,     8,
          8429,     1]])
tensor([[   0,  312, 3582,    3,    9,  388, 4020,   50,   78,  459,    7,    1]])
Le chat a mangé la souris
tensor(0)	<>
tensor(312)	<Le>
tensor(3582)	<chat>
tensor(3)	<>
tensor(9)	<a>
tensor(388)	<man>
tensor(4020)	<gé>
tensor(50)	<la>
tensor(78)	<so>
tensor(459)	<uri>
tensor(7)	<s>
tensor(1)	<>

Le chat est passé de la souris

Error message:

inputs tensor([[13959,  1566,    12,  2379,    10,    37,  1712,    65, 16929,     8,
          8429,     1]])
tensor([[   0,  312, 3582,    3,    9,  388, 4020,   50,   78,  459,    7,    1]])
Le chat a mangé la souris
tensor(0)	<>
tensor(312)	<Le>
tensor(3582)	<chat>
tensor(3)	<>
tensor(9)	<a>
tensor(388)	<man>
tensor(4020)	<gé>
tensor(50)	<la>
tensor(78)	<so>
tensor(459)	<uri>
tensor(7)	<s>
tensor(1)	<>

Le chat a mangé la souris

Outlines/Python version information:

Version information

``` 0.1.7 Python 3.10.12 (main, Nov 6 2024, 20:22:13) [GCC 11.4.0] accelerate @ file://$HOME//.cache/pypoetry/artifacts/1f/ca/9f/f4b7531ea0857b53f6170dc3f877a1cfc9464e8c33211ac65f1e7305d7/accelerate-1.1.1-py3-none-any.whl#sha256=61edd81762131b8d4bede008643fa1e1f3bf59bec710ebda9771443e24feae02 airportsdata @ file://$HOME//.cache/pypoetry/artifacts/d6/dd/a2/7d8fd168a9c5aa8d9b474beecae82edb702945b83fc229c8df9ad43a33/airportsdata-20241001-py3-none-any.whl#sha256=67d71cf2c5378cc17ff66b62b1e11aa2444043949c894543ac8fd8dafce192fd annotated-types @ file://$HOME//.cache/pypoetry/artifacts/bb/01/66/49624ed11fcf662322204636d96e81d2cb8104b9710138a8a6cb4c8916/annotated_types-0.7.0-py3-none-any.whl#sha256=1f02e8b43a8fbbc3f3e0d4f0f4bfc8131bcb4eebe8849b8e5c773f3a1c582a53 attrs @ file://$HOME//.cache/pypoetry/artifacts/77/56/e6/8fb990b4965c67243476a6c86e514e9e217c09e684b7ec2d12a7e87a95/attrs-24.2.0-py3-none-any.whl#sha256=81921eb96de3191c8258c199618104dd27ac608d9366f5e35d011eae1867ede2 blinker @ file://$HOME//.cache/pypoetry/artifacts/62/ad/55/85c60bf6d8a63688e89714f20a8c9d016b2f8c41627249beaa49bb6ea9/blinker-1.9.0-py3-none-any.whl#sha256=ba0efaa9080b619ff2f3459d1d500c57bddea4a6b424b60a91141db6fd2f08bc certifi @ file://$HOME//.cache/pypoetry/artifacts/cd/a9/15/762d1afe97ac5b447613b6888c9afaa3f5c013a77bc24a9153c2ca2bd6/certifi-2024.8.30-py3-none-any.whl#sha256=922820b53db7a7257ffbda3f597266d435245903d80737e34f8a45ff3e3230d8 charset-normalizer @ file://$HOME//.cache/pypoetry/artifacts/e9/e1/3f/3cd049c5cd67c81c505edb7033d0945c78a33192ad9eec563428ff9182/charset_normalizer-3.4.0-cp310-cp310-manylinux_2_17_x86_64.manylinux2014_x86_64.whl#sha256=7f683ddc7eedd742e2889d2bfb96d69573fde1d92fcb811979cdb7165bb9c7d3 click @ file://$HOME//.cache/pypoetry/artifacts/27/c4/ac/2cdddf5c4177ca31564990e662e79484564089fbdf70b0abe7a2f9833c/click-8.1.7-py3-none-any.whl#sha256=ae74fb96c20a0277a1d615f1e4d73c8414f5a98db8b799a7931d1582f3390c28 cloudpickle @ file://$HOME//.cache/pypoetry/artifacts/20/a1/6f/da0c079504aadc9db2f6b5fe9856aa01ddd6619d62b88af9668a71b13c/cloudpickle-3.1.0-py3-none-any.whl#sha256=fe11acda67f61aaaec473e3afe030feb131d78a43461b718185363384f1ba12e conllu @ file://$HOME//.cache/pypoetry/artifacts/85/49/45/b77e881adfbacd203b57679591dc4833158881a3ba30f75d12f939b3af/conllu-6.0.0-py3-none-any.whl#sha256=c47206a0912f768bfae429d3d3c2c7f5ed068babd2502663e865cfb21532cbcc diskcache @ file://$HOME//.cache/pypoetry/artifacts/bd/52/27/f730cef5f7484d3347c8f7a2257a0acf5ae69cec836dfdbb9f5384e8e5/diskcache-5.6.3-py3-none-any.whl#sha256=5e31b2d5fbad117cc363ebaf6b689474db18a1f6438bc82358b024abd4c2ca19 filelock @ file://$HOME//.cache/pypoetry/artifacts/4c/18/52/c77cf5682a8715156928924ed6c01da1b2c43749ac8607f9ae20d398c5/filelock-3.16.1-py3-none-any.whl#sha256=2082e5703d51fbf98ea75855d9d5527e33d8ff23099bec374a134febee6946b0 Flask @ file://$HOME//.cache/pypoetry/artifacts/c5/38/07/354071810b095828121621148f47a7e6ff0fa87d958b6fa5f386f1ecfb/flask-3.1.0-py3-none-any.whl#sha256=d667207822eb83f1c4b50949b1623c8fc8d51f2341d65f72e1a1815397551136 Flask-Cors @ file://$HOME//.cache/pypoetry/artifacts/01/57/7d/e4a66d8a94d0ca45c4531e76fb9a5bd27978f9412291405ba76bf2fbd2/Flask_Cors-5.0.0-py2.py3-none-any.whl#sha256=b9e307d082a9261c100d8fb0ba909eec6a228ed1b60a8315fd85f783d61910bc fsspec @ file://$HOME//.cache/pypoetry/artifacts/0e/ed/79/08c910b251c0bbb5035347be0105bc01fd5c02a636d1d7b397161b01f4/fsspec-2024.10.0-py3-none-any.whl#sha256=03b9a6785766a4de40368b88906366755e2819e758b83705c88cd7cb5fe81871 graphviz @ file://$HOME//.cache/pypoetry/artifacts/b7/f8/3a/914ffc0364f6d62fc9b82ffccfddea57776dd89815fe93b7936a8bc923/graphviz-0.20.3-py3-none-any.whl#sha256=81f848f2904515d8cd359cc611faba817598d2feaac4027b266aa3eda7b3dde5 huggingface-hub @ file://$HOME//.cache/pypoetry/artifacts/33/de/d4/a206abaf6bc2819a00e0f574aa03b6e14bcd98c667e2b91c5058585ec2/huggingface_hub-0.26.3-py3-none-any.whl#sha256=e66aa99e569c2d5419240a9e553ad07245a5b1300350bfbc5a4945cf7432991b idna @ file://$HOME//.cache/pypoetry/artifacts/0a/f8/b1/5ea71b1041ca28dce68bb91dfad2f2f1648aa48103c58576156657025a/idna-3.10-py3-none-any.whl#sha256=946d195a0d259cbba61165e88e65941f16e9b36ea6ddb97f00452bae8b1287d3 interegular @ file://$HOME//.cache/pypoetry/artifacts/51/48/6c/9f918a59361c463c5bae03f74780dc6a166d80051fb22ec6ef96b65595/interegular-0.3.3-py37-none-any.whl#sha256=b0c07007d48c89d6d19f7204972d369b2a77222722e126b6aa63aa721dc3b19c isodate @ file://$HOME//.cache/pypoetry/artifacts/b9/ff/59/3dc8496070b6683ec21ef74ea609eb04bab55c9db26b36d6b8cbfee20b/isodate-0.7.2-py3-none-any.whl#sha256=28009937d8031054830160fce6d409ed342816b543597cece116d966c6d99e15 itsdangerous @ file://$HOME//.cache/pypoetry/artifacts/82/3f/66/fa5ecbd5bc626f1d22f69fb62d7d5614f76bed3c9f43bb821aef0d8439/itsdangerous-2.2.0-py3-none-any.whl#sha256=c6242fc49e35958c8b15141343aa660db5fc54d4f13a1db01a3f5891b98700ef Jinja2 @ file://$HOME//.cache/pypoetry/artifacts/e8/3e/c6/03bfdea230b793470459881e5c066bbace61e23bcf5981a5a012d7b98a/jinja2-3.1.4-py3-none-any.whl#sha256=bc5dd2abb727a5319567b7a813e6a2e7318c39f4f487cfe6c89c6f9c7d25197d jsonschema @ file://$HOME//.cache/pypoetry/artifacts/4d/11/a7/388570faf76e48e634750c6f0650cb1a22623aaa9d703be82725546ffd/jsonschema-4.23.0-py3-none-any.whl#sha256=fbadb6f8b144a8f8cf9f0b89ba94501d143e50411a1278633f56a7acf7fd5566 jsonschema-specifications @ file://$HOME//.cache/pypoetry/artifacts/47/52/b2/f78008bfcb9768464c58f0733590ab5a1634714b0a5e9dad2a081483e8/jsonschema_specifications-2024.10.1-py3-none-any.whl#sha256=a09a0680616357d9a0ecf05c12ad234479f549239d0f5b55f3deea67475da9bf lark @ file://$HOME//.cache/pypoetry/artifacts/61/c7/52/60971039400a3243b394a7218877480136e3aa4ea1eb83b013f6a8f191/lark-1.2.2-py3-none-any.whl#sha256=c2276486b02f0f1b90be155f2c8ba4a8e194d42775786db622faccd652d8e80c MarkupSafe @ file://$HOME//.cache/pypoetry/artifacts/54/16/34/9dc660c8303e901b3915b67da790ee8eb4dcc2a6e3a385aae6cefc6cb1/MarkupSafe-3.0.2-cp310-cp310-manylinux_2_17_x86_64.manylinux2014_x86_64.whl#sha256=bbcb445fa71794da8f178f0f6d66789a28d7319071af7a496d4d507ed566270d mpmath @ file://$HOME//.cache/pypoetry/artifacts/1c/fb/47/f07b13ae35a17918fa8c9fb49661f682e82dae30f527e9e3b11baf2735/mpmath-1.3.0-py3-none-any.whl#sha256=a0b2b9fe80bbcd81a6647ff13108738cfb482d481d826cc0e02f5b35e5c88d2c nest-asyncio @ file://$HOME//.cache/pypoetry/artifacts/c0/07/0c/52d440dddeaab87af59928b6b24edc2fcecaec3fd4fe019b8419f904a9/nest_asyncio-1.6.0-py3-none-any.whl#sha256=87af6efd6b5e897c81050477ef65c62e2b2f35d51703cae01aff2905b1852e1c networkx @ file://$HOME//.cache/pypoetry/artifacts/93/06/16/3feb7e2163c46a025f557a0d5ea11e4503f576dc73c4cff97723d05ea8/networkx-3.4.2-py3-none-any.whl#sha256=df5d4365b724cf81b8c6a7312509d0c22386097011ad1abe274afd5e9d3bbc5f numpy @ file://$HOME//.cache/pypoetry/artifacts/66/2b/61/ea41442fde7ec0a894640f0a8beb9ee1a4a4c1a9fb0b27f6ac2ecaa907/numpy-2.1.3-cp310-cp310-manylinux_2_17_x86_64.manylinux2014_x86_64.whl#sha256=78574ac2d1a4a02421f25da9559850d59457bac82f2b8d7a44fe83a64f770098 nvidia-cublas-cu12 @ file://$HOME//.cache/pypoetry/artifacts/07/53/d4/99fd91e76df1445d7680ffcdc5c4ba68174ce7a4f516e22c31cd75af4a/nvidia_cublas_cu12-12.4.5.8-py3-none-manylinux2014_x86_64.whl#sha256=2fc8da60df463fdefa81e323eef2e36489e1c94335b5358bcb38360adf75ac9b nvidia-cuda-cupti-cu12 @ file://$HOME//.cache/pypoetry/artifacts/93/6c/ca/26e0e8d8a6d2f3c01e6a2a0eb13c1db9b19060a566965c8f564606e589/nvidia_cuda_cupti_cu12-12.4.127-py3-none-manylinux2014_x86_64.whl#sha256=9dec60f5ac126f7bb551c055072b69d85392b13311fcc1bcda2202d172df30fb nvidia-cuda-nvrtc-cu12 @ file://$HOME//.cache/pypoetry/artifacts/33/ce/8c/fe5707152a27c5e73525c4e3587e7831f53ea97666974fc4a3daae10dc/nvidia_cuda_nvrtc_cu12-12.4.127-py3-none-manylinux2014_x86_64.whl#sha256=a178759ebb095827bd30ef56598ec182b85547f1508941a3d560eb7ea1fbf338 nvidia-cuda-runtime-cu12 @ file://$HOME//.cache/pypoetry/artifacts/6e/50/57/d460e5b19d92d68df659ded6f7ae9cfb563198bcde1768585bb6596517/nvidia_cuda_runtime_cu12-12.4.127-py3-none-manylinux2014_x86_64.whl#sha256=64403288fa2136ee8e467cdc9c9427e0434110899d07c779f25b5c068934faa5 nvidia-cudnn-cu12 @ file://$HOME//.cache/pypoetry/artifacts/e5/97/a2/0b2f2430240e336bbf163a0a2eb47b3545a39ba52c4a5232966776dbd8/nvidia_cudnn_cu12-9.1.0.70-py3-none-manylinux2014_x86_64.whl#sha256=165764f44ef8c61fcdfdfdbe769d687e06374059fbb388b6c89ecb0e28793a6f nvidia-cufft-cu12 @ file://$HOME//.cache/pypoetry/artifacts/1a/95/b7/5ed6362aee944a5e7458e774bb0e7aae4ae2af758e0f682c5f37874a4b/nvidia_cufft_cu12-11.2.1.3-py3-none-manylinux2014_x86_64.whl#sha256=f083fc24912aa410be21fa16d157fed2055dab1cc4b6934a0e03cba69eb242b9 nvidia-curand-cu12 @ file://$HOME//.cache/pypoetry/artifacts/22/66/7d/0ce0d1944f9b018b700f17a8dafe6f6f7ab75b751ef0fe99c8a3248701/nvidia_curand_cu12-10.3.5.147-py3-none-manylinux2014_x86_64.whl#sha256=a88f583d4e0bb643c49743469964103aa59f7f708d862c3ddb0fc07f851e3b8b nvidia-cusolver-cu12 @ file://$HOME//.cache/pypoetry/artifacts/2e/47/5b/582733eb1d9b7792e7d85cc068e88defea98deb31a714f00f6ad7a58e6/nvidia_cusolver_cu12-11.6.1.9-py3-none-manylinux2014_x86_64.whl#sha256=19e33fa442bcfd085b3086c4ebf7e8debc07cfe01e11513cc6d332fd918ac260 nvidia-cusparse-cu12 @ file://$HOME//.cache/pypoetry/artifacts/0a/08/a9/078a35888acfe38e17a70fee298585d92f93dd4f3fabd3a596f39a8a8b/nvidia_cusparse_cu12-12.3.1.170-py3-none-manylinux2014_x86_64.whl#sha256=ea4f11a2904e2a8dc4b1833cc1b5181cde564edd0d5cd33e3c168eff2d1863f1 nvidia-nccl-cu12 @ file://$HOME//.cache/pypoetry/artifacts/ec/fd/5d/d239f1d901be875950b5bb23e06f234dd4135d80d2d263d1c5d4f5228a/nvidia_nccl_cu12-2.21.5-py3-none-manylinux2014_x86_64.whl#sha256=8579076d30a8c24988834445f8d633c697d42397e92ffc3f63fa26766d25e0a0 nvidia-nvjitlink-cu12 @ file://$HOME//.cache/pypoetry/artifacts/3b/86/a6/a6bdc3f1417bf0bcd58ddaeca75507ec5838f2be6b270e9c41234ad694/nvidia_nvjitlink_cu12-12.4.127-py3-none-manylinux2014_x86_64.whl#sha256=06b3b9b25bf3f8af351d664978ca26a16d2c5127dbd53c0497e28d1fb9611d57 nvidia-nvtx-cu12 @ file://$HOME//.cache/pypoetry/artifacts/34/e2/f9/05c10d15519202a45d2b0d9fc575ed57e2b16367d1c8a1d406f91bd2ee/nvidia_nvtx_cu12-12.4.127-py3-none-manylinux2014_x86_64.whl#sha256=781e950d9b9f60d8241ccea575b32f5105a5baf4c2351cab5256a24869f12a1a outlines @ file://$HOME//.cache/pypoetry/artifacts/43/90/9a/b98e07d741a8815f71d6054e258245dffdff2c69f4166a97b205bf3247/outlines-0.1.7-py3-none-any.whl#sha256=0a9054c789d52a712bd2d6b6496c9bb81886ae2f9ab386a5ed75b38d1740f2cd outlines_core @ file://$HOME//.cache/pypoetry/artifacts/ac/fc/a7/62c204214599d7ef0a9aff5aa00567103e5890b8105ee61d805da860ba/outlines_core-0.1.17-cp310-cp310-manylinux_2_17_x86_64.manylinux2014_x86_64.whl#sha256=d381e7ff0be6797dbbb6a5d6b3c60dd8fb862bf829ccdd45de86b8886e5e9a00 oxrdflib @ file://$HOME//.cache/pypoetry/artifacts/97/37/e6/a9f9ef4d18f4bbb5c31d3bc6c52d2768f3f61eb68decd9bdad636e8db8/oxrdflib-0.4.0-py3-none-any.whl#sha256=c6203636b05817e21fbe7c469154b2e312593d0801cdaa14058c2d99dcfc12a6 packaging @ file://$HOME//.cache/pypoetry/artifacts/f0/e4/ae/eacd18d6ea3a9f0231adf53d076daa7eb0ce0289820156d540f9f2b209/packaging-24.2-py3-none-any.whl#sha256=09abb1bccd265c01f4a3aa3f7a7db064b36514d2cba19a2f694fe6150451a759 Penman @ file://$HOME//.cache/pypoetry/artifacts/a9/42/9d/8061d28b96e1c89e3cb63edbed5f8532c4ecf023fa6ab1894daff750b7/penman-1.3.1-py3-none-any.whl#sha256=1444005a178e7ea2bcee2cc51c5f6aae6f7b1bb916a2764c7f1b5d0e304fcdca psutil @ file://$HOME//.cache/pypoetry/artifacts/1e/49/b9/ee807a04a302b249b4ab2ffaa481442eab150bc3f0f674a7af27d0614e/psutil-6.1.0-cp36-abi3-manylinux_2_12_x86_64.manylinux2010_x86_64.manylinux_2_17_x86_64.manylinux2014_x86_64.whl#sha256=498c6979f9c6637ebc3a73b3f87f9eb1ec24e1ce53a7c5173b8508981614a90b pycountry @ file://$HOME//.cache/pypoetry/artifacts/ba/dc/a2/b4026fae71cbc6cdffcdd2ffb476c6d6d122b56e9dd7aa57d05a8a3566/pycountry-24.6.1-py3-none-any.whl#sha256=f1a4fb391cd7214f8eefd39556d740adcc233c778a27f8942c8dca351d6ce06f pydantic @ file://$HOME//.cache/pypoetry/artifacts/74/27/79/6512a2ca525c9a34ae427d3964bb2de6ad17415387a392fba35e9561ba/pydantic-2.10.3-py3-none-any.whl#sha256=be04d85bbc7b65651c5f8e6b9976ed9c6f41782a55524cef079a34a0bb82144d pydantic_core @ file://$HOME//.cache/pypoetry/artifacts/11/6a/93/ca7a3da675dc9ff38f0cbb40896ea5468cf98ad150e62728d4b575ec26/pydantic_core-2.27.1-cp310-cp310-manylinux_2_17_x86_64.manylinux2014_x86_64.whl#sha256=45d9c5eb9273aa50999ad6adc6be5e0ecea7e09dbd0d31bd0c65a55a2592ca08 pyoxigraph @ file://$HOME//.cache/pypoetry/artifacts/a1/84/5b/2a0448b43fbf84eac08948cf3f803b51c8b3aceed07ea6ab3b23d82dd6/pyoxigraph-0.4.4-cp310-cp310-manylinux_2_17_x86_64.manylinux2014_x86_64.whl#sha256=3541bff52d274db820570c42987fbac87fcc4ffea06e15800782d50b841526c2 pyparsing @ file://$HOME//.cache/pypoetry/artifacts/7b/bd/d8/0e0002afd8303923363d84a2e844e35d0def35d56575e77a95f4fdc010/pyparsing-3.2.0-py3-none-any.whl#sha256=93d9577b88da0bbea8cc8334ee8b918ed014968fd2ec383e868fb8afb1ccef84 PyYAML @ file://$HOME//.cache/pypoetry/artifacts/04/5d/5a/a2171b7eefee9ec7d0c041d022d53a7427fbc4c724c73dda43983ed57b/PyYAML-6.0.2-cp310-cp310-manylinux_2_17_x86_64.manylinux2014_x86_64.whl#sha256=ec031d5d2feb36d1d1a24380e4db6d43695f3748343d99434e6f5f9156aaa2ed rdflib @ file://$HOME//.cache/pypoetry/artifacts/60/99/b7/6158fbf29548e6ec5fa35e2d800c84403351c72677fb1d672166865971/rdflib-7.1.1-py3-none-any.whl#sha256=e590fa9a2c34ba33a667818b5a84be3fb8a4d85868f8038f17912ec84f912a25 referencing @ file://$HOME//.cache/pypoetry/artifacts/03/f2/db/b962d4612c145eeee668790247f1f8423e8ad64a8688c6e8c666ce908a/referencing-0.35.1-py3-none-any.whl#sha256=eda6d3234d62814d1c64e305c1331c9a3a6132da475ab6382eaa997b21ee75de regex @ file://$HOME//.cache/pypoetry/artifacts/e9/dd/94/8e68c66f9673a57ac5866004e72af9c21f1671aa500d5e726777780cb9/regex-2024.11.6-cp310-cp310-manylinux_2_17_x86_64.manylinux2014_x86_64.whl#sha256=997d6a487ff00807ba810e0f8332c18b4eb8d29463cfb7c820dc4b6e7562d0cf requests @ file://$HOME//.cache/pypoetry/artifacts/18/ee/eb/bbe48a91726fe6db009c50103ed65c49783f0715ea82dfbc46869b9c85/requests-2.32.3-py3-none-any.whl#sha256=70761cfe03c773ceb22aa2f671b4757976145175cdfca038c02654d061d6dcc6 rpds-py @ file://$HOME//.cache/pypoetry/artifacts/dd/13/9a/fd7b99f6809fbaf7761dc1391550d8df495c8a88810569d9e85351a895/rpds_py-0.22.3-cp310-cp310-manylinux_2_17_x86_64.manylinux2014_x86_64.whl#sha256=bc27863442d388870c1809a87507727b799c8460573cfbb6dc0eeaef5a11b5ec safetensors @ file://$HOME//.cache/pypoetry/artifacts/70/b0/60/69029ca56fd3095ca8ba67da4f0f4f900eb2711fdb57e4b43c3148daaf/safetensors-0.4.5-cp310-cp310-manylinux_2_17_x86_64.manylinux2014_x86_64.whl#sha256=c6d156bdb26732feada84f9388a9f135528c1ef5b05fae153da365ad4319c4c5 sentencepiece @ file://$HOME//.cache/pypoetry/artifacts/22/61/27/586f943d32f32a5d27e3890091c8e1614ffe630d093d8c08c38739a283/sentencepiece-0.2.0-cp310-cp310-manylinux_2_17_x86_64.manylinux2014_x86_64.whl#sha256=1380ce6540a368de2ef6d7e6ba14ba8f3258df650d39ba7d833b79ee68a52040 smatch @ file://$HOME//.cache/pypoetry/artifacts/90/55/8b/eea2518c3ce738750d2c793a69415598d3362c18464a26203c98e6b68a/smatch-1.0.4.tar.gz#sha256=33f4401dd0c23517fb64872bb4981e081a8a58a7bb1f34a4bf04243de30e19e9 sympy @ file://$HOME//.cache/pypoetry/artifacts/02/09/7f/076684026445a949059638292445fd4dfcc732f3bcce802dad251c0b85/sympy-1.13.1-py3-none-any.whl#sha256=db36cdc64bf61b9b24578b6f7bab1ecdd2452cf008f34faa33776680c26d66f8 tokenizers @ file://$HOME//.cache/pypoetry/artifacts/65/62/fa/b80a3ca76fa27aec020aa23d720890f87c0fbdbc6e997950df02941752/tokenizers-0.21.0-cp39-abi3-manylinux_2_17_x86_64.manylinux2014_x86_64.whl#sha256=e84ca973b3a96894d1707e189c14a774b701596d579ffc7e69debfc036a61a04 torch @ file://$HOME//.cache/pypoetry/artifacts/08/46/03/3eb2455539cdad8b004a4bc10f9db48072ea281d313450e78695717f75/torch-2.5.1-cp310-cp310-manylinux1_x86_64.whl#sha256=71328e1bbe39d213b8721678f9dcac30dfc452a46d586f1d514a6aa0a99d4744 tqdm @ file://$HOME//.cache/pypoetry/artifacts/9e/43/fc/501d9d774be9ae5ed427f4045e61a50e97d34006d87b1e2613b19e14ad/tqdm-4.67.1-py3-none-any.whl#sha256=26445eca388f82e72884e0d580d5464cd801a3ea01e63e5601bdff9ba6a48de2 transformers @ file://$HOME//.cache/pypoetry/artifacts/ff/21/29/375b0d5a32f100e2a167ad34cd9a15d9d9344951e176edbcb6fe994fc7/transformers-4.47.0-py3-none-any.whl#sha256=a8e1bafdaae69abdda3cad638fe392e37c86d2ce0ecfcae11d60abb8f949ff4d triton @ file://$HOME//.cache/pypoetry/artifacts/27/c1/96/22f0f15b522be35dfafe6286316dab9e694bc472427c8bfb024d17965a/triton-3.1.0-cp310-cp310-manylinux_2_17_x86_64.manylinux2014_x86_64.whl#sha256=6b0dd10a925263abbe9fa37dcde67a5e9b2383fc269fdf59f5657cac38c5d1d8 typing_extensions @ file://$HOME//.cache/pypoetry/artifacts/39/22/40/de1ad858cb2490eb53124ad6f89105f03b4ebb4f23fc766c6b2995e583/typing_extensions-4.12.2-py3-none-any.whl#sha256=04e5ca0351e0f3f85c6853954072df659d0d13fac324d0072316b67d7794700d urllib3 @ file://$HOME//.cache/pypoetry/artifacts/90/bb/d0/b1077be7eeaded85b6608fb11d809e0906b4fa9a99ac941fb7fc94bbbb/urllib3-2.2.3-py3-none-any.whl#sha256=ca899ca043dcb1bafa3e262d73aa25c465bfb49e0bd9dd5d59f1d0acba2f8fac Werkzeug @ file://$HOME//.cache/pypoetry/artifacts/ac/6d/14/20f8b35a98fa7ec78de7959034a0c630d69d20c9697c64ccbdfbc07e40/werkzeug-3.1.3-py3-none-any.whl#sha256=54b78bf3716d19a65be4fceccc0d1d7b89e608834989dfae50ea87564639213e

</details>


### Context for the issue:

_No response_

The text was updated successfully, but these errors were encountered:

jheinecke added the bug label Dec 9, 2024

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

"thick underscore" tokens of T5 and MT5 models cause error in CFG #1329

"thick underscore" tokens of T5 and MT5 models cause error in CFG #1329

jheinecke commented Dec 9, 2024

"thick underscore" tokens of T5 and MT5 models cause error in CFG #1329

"thick underscore" tokens of T5 and MT5 models cause error in CFG #1329

Comments

jheinecke commented Dec 9, 2024

Describe the issue as clearly as possible:

Steps/code to reproduce the bug:

Expected result:

Error message:

Outlines/Python version information: