AndroidEnv

אַ צובינד פֿאַר רעינפאָרסעמענט לערן צו אַקסעס די אַנדרויד אַס

אין אַ בליק: AndroidEnv

AndroidEnv איז אַ נייַע שיכטע וואָס קענען טריינינג רעינפאָרסעמענט לערנען אגענטן אויף אַנדרויד אַס, דעוועלאָפּעד דורך דעעפּמינד, די גאַנץ באַרימט אַי-צווייַג פון אַלפאַבעט. עס זיצט צווישן Android און ADB אויף די איין זייַט און אַן אַגענט וואָס איז טריינד אויף די אנדערע זייַט. אויב איר טאָן ניט וויסן, "אַגענט" רעפערס צו אַ מאַשין-לערנען אַפּלאַקיישאַן איר קענען קאָד און לויפן. AndroidEnv איז בארעכטיגט ווי אַ אָפֿן מקור ריפּאַזאַטאָרי אויף Github.

א רעאַליסטיש אַקסעס צו אַנדרויד

AndroidEnv יימז צו צושטעלן אַ סוויווע וואָס איז ווי רעאַליסטיש ווי מעגלעך פֿאַר טריינינג, און די געווענדט קאַנסטריינץ גלייַכן די וואָס מיר קענען דערוואַרטן פֿאַר יומאַנז וואָס אויך ינטעראַקט מיט אַנדרויד:

  • אַ אַגענט קענען בפֿרט לייענען די בילדצעלן וואָס אַנדרויד רענדערז; פֿאַר דעם שטריך, אַ צובינד וואָס סימיאַלייץ אַ טאָוטשסקרעען איז געניצט פֿאַר
  • דער קאַמף פּלאַץ (שטעלן פון פאַראַנען אָפּציעס צו ינטעראַקט מיט די סוויווע) איז קאַמפּאָוזד פון עטלעכע פּשוט אַקשאַנז, אַזאַ ווי פאַרבינדן, הייבן אָדער אַראָפּנעמען

דער ציל פון AndroidEnv איז צו שטופּן די באַונדריז פֿאַר רעינפאָרסעמענט לערנען. ענלעך צו OpenAI ס "וניווערסע" פּלאַטפאָרמע, וואָס ענייבאַלד אַגענץ צו ינטעראַקט מיט סינז דורך אַ צובינד פֿאַר מויז און קלאַוויאַטור, די לעצטע שאַפונג פון דעעפּמינד אַלאַוז דעוועלאָפּערס צו באַן זייער מאָדעלס אין איינער פון די מערסט טשאַלאַנדזשינג ינווייראַנמאַנץ ימאַדזשאַנאַבאַל.

וואָס איך מיינען איז אַז פריערדיקע מאָדעלס האָבן אַקסעס צו זייער טאַרגאַץ דורך אַ ספּעציעל צובינד וואָס סימפּלי סימפּלי ינטעראַקשאַן. אַנדרוידענוו אויך ניט צושטעלן פיל נאָך אינפֿאָרמאַציע באַזונדער פון די בילדצעלן פון דעם עקראַן (מער אויף אַז שפּעטער), וואָס מאכט זייַן נוצן אַזוי רעאַליסטיש.

א נעענטער קוק אויף ינטעראַקשאַן

ווי דערמאנט, AndroidEnv אָפפערס אַ סכום פון רוי אַקשאַנז אַז אַלע סימולירן יקערדיק מווומאַנץ אַ מענטש וואָלט אויך נוצן ווען ינטעראַקטינג מיט אַ טאָוטשסקרעען. די רוי אַקשאַנז זענען קאַמפּלאַמענטיד דורך אַ גאַנג פון דזשעסטשערז וואָס לאָזן עפעקטיוו קאָנטראָל דורך די אַגענט, אַזאַ ווי סוויפּינג אָדער סקראָללינג.

ינטעראַקטיאָנס מיט AndroidEnv אויך ויסלייזן איינער פון די גרויס טשאַלאַנדזשיז אויף דעם פּלאַטפאָרמע: דיפּענדינג אויף די אָפֿן אַפּ (אָדער טאַסק אין אַלגעמיין), זיי קענען זיין דראַסטיקלי אַנדערש אין טייַטש. א לאַקכענען אין איין אַפּ קען זיין געניצט אין אַ גאָר אַנדערש קאָנטעקסט אין אן אנדער אַפּ.

אויך וויכטיק: אגענטן אויף AndroidEnv האָבן צו האַנדלען מיט די פאַקטיש צייט נאַטור פון אַ פאַקטיש צייט אַס, ווי אַנדרויד. דעם מיטל אַז עס איז ניט ווארטן פון די אַפּלאַקיישאַן ביז דער אַגענט שטעלט די ווייַטער קאַמף - די אַס נאָר האלט אויף. דאָס איז אַ באַזונדער שווער אַרויסרופן פֿאַר אַגענץ צו באַקומען. AndroidEnv פּראָווידעס אַ קליין קאַמפּאַטאַבילאַטי געצייַג צו ויסמיידן פאַלש positive ינפּוץ אין פאַל די אַגענט נעמט צו לאַנג צו רעאַגירן (אַזאַ ווי לאָזן אַ צאַפּן בעשאַס פּראַסעסינג, וואָס פירט צו אַ לאַנג דרוק ינטערפּריטאַד דורך אַנדרויד).

דיפיינינג טאַסקס וואָס מוזן זיין דורכגעקאָכט

א אַרבעט דיפיינז אַ ספּעציפיש פּראָבלעם וואָס אַ RL אַגענט דאַרף סאַלווד. צו דערלויבן אַ געהעריק טריינינג פון דיין אַגענט, טאַסקס כאַפּן עטלעכע באַטייטיק דאַטן אַספּעקץ:

  • "טנאָים פון עפּיזאָד טערמאַניישאַן": ווען די אַרבעט איז דורכגעקאָכט אָדער ווען עס איז באשטימט ניט אַנדערש
  • "ריוואָרדז": פּראַוויידינג נומעריקאַל באַמערקונגען פֿאַר אַטשיווד צילן
  • אנדערע אַפּלאַקיישאַנז וואָס קענען זיין ינטעראַקטיד פֿאַר די אַרבעט

AndroidEnv האט אַקסעס צו ADB, די "אַנדרויד דיווייס בריק", וואָס איז אַ שטראָם פון לאָגס פֿון די מיטל און דערפֿאַר אַלאַוז אַ אַרבעט צו אָבסערווירן עס און צינגל פּרידיפיינד סיגנאַלז ווען נייטיק.

א ים פון פּאַסאַבילאַטיז

די מעגלעך ווירקונג AndroidEnv קען האָבן אויף די קוילעלדיק אַנטוויקלונג פון אַי און רעינפאָרסעמענט לערנען אין באַזונדער קענען ניט זיין אָוווערסטייטיד. עס אַלאַוז אַגענץ ניט בלויז צו לערנען ווי צו ינטעראַקט מיט אַנדרויד ("עפֿענען מאַפּס און זוכן פֿאַר אַ נירביי סושי רעסטאָראַן"), אָבער אויך צולייגן פאַרשידן אנדערע טעקניקס פֿאַר פּראָבלעם סאַלווינג, דיפּענדינג אויף די אַפּ. למשל, אַ אַגענט קענען זיין טריינד אין פּלייינג שפּילערייַ (אַלע אַנדרויד שפּילערייַ איז בארעכטיגט!) צו אַנטוויקלען לאַנג-טערמין ווינינג סטראַטעגיעס.

AndroidEnv איז דער טויער וואָס איז עפן פֿאַר ווער עס יז צו שרייַבן ML מאָדעלס וואָס קענען זיין טריינד אין כּמעט יעדער מעגלעך אַרבעט. עס ס מיינונג בלאָוינג!

באַשטעטיקן זעגל

ווי איך בין נישט אַ ינזשעניר פֿאַר מאַשין לערנען, מיין וויסן איז בלויז ייבערפלאַך-מדרגה. דער אַרטיקל איז אַ הקדמה צו AndroidEnv, אָבער פֿאַר מער אינפֿאָרמאַציע, ביטע טשעק די אַדענדאַם מיט אַלע באַטייַטיק לינקס, אַרייַנגערעכנט די Github-repository.

פֿאָרשלאָגן

פֿאַרבונדענע

נאָך-וואָרט

שפּראַכן