Uwekaji, Uchaguzi na Uelekezaji wa Huduma za Akili Bandia Zisizo Kuu katika Mitandao ya Mkononi

Yaliyomo

1. Utangulizi

Uchukuzi wa haraka wa huduma za Akili Bandia (AI), hasa miundo mikubwa kama mfululizo wa GPT wa OpenAI, unabadilisha kimsingi mifumo ya trafiki katika mitandao ya kisasa ya mawasiliano. Ingawa huduma za sasa za AI zinapatikana hasa kwa mashirika makubwa, utabiri unaonyesha mabadiliko kuelekea mfumo wa AI usio kuu ambapo mashirika madogo na hata watumiaji binafsi wanaweza kuendesha miundo yao wenyewe ya AI. Mabadiliko haya yanaweka changamoto kubwa katika kuweka usawa kati ya ubora wa huduma na ucheleweshaji huku ukikabiliana na mwendo wa watumiaji katika muundo wowote wa mtandao.

Mbinu za kitamaduni za Kompyuta ya Kingo ya Mkononi (MEC) hazitoshi katika muktadha huu kutokana na utegemezi wao wa miundo ya udhibiti wa ngazi na dhana kuhusu mitandao isiyobadilika. Ukuaji wa kipeo katika ukubwa wa miundo ya AI (mfano, GPT-4 yenye takriban trilioni 1.8 ya vigezo) hufanya uhamiaji wa wakati halisi usiwezekani, na kuhitaji ufumbuzi wa uvumilivu kwa usaidizi wa mwendo bila uhamisho wa gharama kubwa wa miundo.

Ufahamu Muhimu

Mfumo wa AI usio kuu unawezesha mashirika madogo kuendesha huduma
Mbinu za kitamaduni za MEC hazitoshi kwa miundo mikuu ya AI
Uchimbaji wa trafiki hutoa usaidizi wa mwendo bila uhamisho wa muundo
Ucheleweshaji usio laini wa foleni unahitaji ubora usio laini

2. Muundo wa Mfumo na Uundaji wa Tatizo

2.1 Mfano wa Mtandao na Vipengele

Mfumo uliopendekezwa unafanya kazi katika mazingira ya mtandao mchanganyiko unaojumuisha seva za wingu, vituo vya msingi, vitengo vya kando ya barabara, na watumiaji wa mkononi. Mtandao unasaidia miundo mbalimbali ya AI iliyofunzwa awali na sifa tofauti za ubora na ucheleweshaji. Vipengele muhimu vinajumuisha:

Seva za Wingu: Huendesha miundo mikuu ya AI yenye uwezo mkubwa wa hesabu
Vituo vya Msingi na Vitengo vya Kando ya Barabara: Hutoa chanjo ya waya na rasilimali za kompyuta ya kingo
Watumiaji wa Mkononi: Hutoa maombi kwa huduma za AI na mifumo ya mwendo
Miundo ya AI: Miundo iliyofunzwa awali na usawazishaji tofauti wa usahihi-na-ucheleweshaji

2.2 Uundaji wa Tatizo

Tatizo la pamoja la ubora linashughulikia maamuzi ya uwekaji wa huduma, uchaguzi, na uelekezaji ili kuweka usawa kati ya ubora wa huduma na ucheleweshaji wa mwisho-hadi-mwisho. Uundaji huu unazingatia:

Ucheleweshaji usio laini wa foleni kwenye nodi za mtandao
Mifumo ya mwendo wa watumiaji na matukio ya kuhama
Vikwazo vya uwekaji wa muundo kutokana na ukomo wa kuhifadhi
Mahitaji ya ubora-wa-huduma kwa programu tofauti

3. Mbinu ya Kiufundi

3.1 Uchimbaji wa Trafiki kwa Usaidizi wa Mwendo

Ili kukabiliana na changamoto ya mwendo wa mtumiaji bila uhamisho wa gharama kubwa wa muundo wa AI, tunatumia uchimbaji wa trafiki. Mtumiaji anaposogea kati ya pointi za upatikanaji wa waya, pointi ya upatikanaji ya asili hutumika kama nanga. Majibu kutoka kwa seva za mbali yanaelekezwa kurudi kwenye nodi hii ya nanga, ambayo kisha hupeleka matokeo kwa eneo jipya la mtumiaji. Mbinu hii:

Huondoa hitaji la uhamisho wa muundo wa AI wa wakati halisi
Hudumisha mwendelezo wa huduma wakati wa matukio ya mwendo
Huanzisha mzigo wa ziada wa trafiki ambao lazima udhibitiwe

3.2 Algorithm ya Frank-Wolfe Isiyo Kuu

Tunatengeneza algorithm ya ubora isiyo kuu kulingana na mbinu ya Frank-Wolfe na itifaki mpya ya ujumbe. Algorithm hii:

Hufanya kazi bila uratibu wa kati
Hugeukia kwenye bora za ndani za tatizo lisilo laini
Hutumia ujumbe mdogo wa kupita kati ya nodi jirani
Hubadilika kulingana na mabadiliko ya hali ya mtandao na mahitaji ya watumiaji

3.3 Uundaji wa Kihisabati

Tatizo la ubora linaundwa kama programu isiyo laini ikizingatia usawazishaji kati ya ubora wa huduma $Q$ na ucheleweshaji wa mwisho-hadi-mwisho $L$. Kazi lengo inachanganya mambo haya:

$$\min_{x,y,r} \sum_{u \in U} \left[ \alpha L_u(x,y,r) - \beta Q_u(x,y) \right]$$

Chini ya vikwazo:

$$\sum_{m \in M} s_m y_{n,m} \leq S_n, \forall n \in N$$

$$\sum_{m \in M} x_{u,m} = 1, \forall u \in U$$

$$x_{u,m}, y_{n,m} \in \{0,1\}, r_{u,n} \geq 0$$

Ambapo $x_{u,m}$ inaonyesha mtumiaji $u$ anachagua muundo $m$, $y_{n,m}$ inaonyesha nodi $n$ inaendesha muundo $m$, $r_{u,n}$ ni uamuzi wa uelekezaji, $s_m$ ni ukubwa wa muundo, na $S_n$ ni uwezo wa kuhifadhi wa nodi.

4. Matokeo ya Majaribio

4.1 Tathmini ya Utendaji

Tathmini za nambari zinaonyesha maboresho makubwa ya utendaji ikilinganishwa na mbinu zilizopo. Mbinu iliyopendekezwa inapunguza ucheleweshaji wa mwisho-hadi-mwisho kwa 25-40% ikilinganishwa na ufumbuzi wa kawaida wa MEC huku ikidumisha ubora sawa wa huduma. Matokeo muhimu yanajumuisha:

Uchimbaji wa trafiki unasaidia mwendo kwa ufanisi na upungufu mdogo wa utendaji
Algorithm isiyo kuu inaongezeka kwa ufanisi na ukubwa wa mtandao
Ubora wa pamoja huzidi mbinu za kufanya maamuzi kwa mlolongo

4.2 Ulinganisho na Mbinu za Msingi

Mfumo uliopendekezwa ulilinganishwa na mbinu tatu za msingi:

MEC ya Kati: Kompyuta ya kingo ya kitamaduni ya ngazi
Uwekaji Tuli: Uwekaji wa muundo uliowekwa bila kubadilika
Uchaguzi wa Ulafi: Uchaguzi wa huduma wa myopic bila uratibu

Matokeo yanaonyesha mbinu yetu inafikia ucheleweshaji wa chini zaidi 30% kuliko MEC ya kati na uboreshaji wa 45% ikilinganishwa na uwekaji tuli katika hali za mwendo mwingi.

5. Maelezo ya Utekelezaji

5.1 Utekelezaji wa Msimbo

Algorithm ya Frank-Wolfe isiyo kuu imetekelezwa na vipengele vifuatavyo muhimu:

class DecentralizedAIOptimizer:
    def __init__(self, network_graph, models, users):
        self.graph = network_graph
        self.models = models
        self.users = users
        self.placement = {}
        self.routing = {}
        
    def frank_wolfe_iteration(self):
        # Kokotoa viambajengo vya ndani kwenye kila nodi
        gradients = self.compute_local_gradients()
        
        # Badilishana taarifa za kiambajengo na majirani
        self.exchange_gradients(gradients)
        
        # Tatua tatizo ndogo la mstari la ndani
        direction = self.solve_linear_subproblem()
        
        # Kokotoa ukubwa wa hatua na sasisha ufumbuzi
        step_size = self.line_search(direction)
        self.update_solution(direction, step_size)
        
    def optimize(self, max_iterations=100):
        for iteration in range(max_iterations):
            self.frank_wolfe_iteration()
            if self.convergence_check():
                break
        return self.placement, self.routing

5.2 Itifaki ya Ujumbe

Itifaki mpya ya ujumbe inawezesha uratibu wenye ufanisi kati ya nodi na mzigo mdogo wa mawasiliano. Kila ujumbe una:

Taarifa za kiambajengo vya ndani kwa ubora
Maamuzi ya sasa ya uwekaji na uelekezaji
Hali ya mtandao na upatikanaji wa rasilimali
Utabiri wa mwendo wa watumiaji

6. Matumizi na Mwelekeo wa Baadaye

Mfumo uliopendekezwa una matumizi mapana katika mitandao inayoongozwa na AI inayokua:

Magari Yenye Kujitegemea: Uhakiki wa AI wa wakati halisi kwa urambazaji na mtazamo
Miji Smart: Huduma za AI zilizosambazwa kwa miundombinu ya mijini
IoT ya Viwanda: AI ya kingo kwa utengenezaji na matengenezo ya utabiri
Programu za AR/VR: Usindikaji wa AI wa ucheleweshaji mdogo kwa uzoefu wa kuzama

Mwelekeo wa utafiti wa baadaye unajumuisha:

Ujumuishaji na ujifunzaji wa shirikisho kwa AI inayohifadhi faragha
Kubadilika kwa algoriti za ubora zilizochochewa na quantum
Upanuzi kwa huduma za AI za hali nyingi na ubora wa muundo mwingi
Kujumuishwa kwa mazingatio ya ufanisi wa nishati

7. Uchambuzi wa Asili

Utafiti huu unawakilisha maendeleo makubwa katika usimamizi wa huduma za AI zisizo kuu, ukikabiliana na changamoto muhimu katika makutano ya mitandao ya mkononi na akili bandia. Matumizi ya uvumilivu ya mfumo uliopendekezwa ya uchimbaji wa trafiki kwa usaidizi wa mwendo bila uhamisho wa muundo yanastahili kusisitwa, kwani huzuia kikwazo cha msingi cha mbinu za kitamaduni za MEC zinapokabiliana na miundo mikuu ya AI. Kama vile CycleGAN (Zhu et al., 2017) ilivyobadilisha kutafsiri picha-hadi-picha bila data ya mafunzo ya jozi, kazi hii inabadilisha usimamizi wa mwendo katika mitandao inayohudumia AI kwa kuepuka kazi ya kuzuia hesabu ya uhamisho wa muundo wa wakati halisi.

Uundaji wa kihisabati unaojumuisha ucheleweshaji usio laini wa foleni unaonyesha ukweli tata wa mienendo ya mtandao, ukisonga zaidi ya miundo rahisi ya mstari iliyotumika kawaida katika kazi za awali. Mbinu hii inalingana na mienendo ya hivi karibuni katika utafiti wa ubora wa mtandao, kama kazi ya Chen et al. (2022) juu ya hesabu ya mtandao isiyo laini, lakini inaipanua kwa muktadha maalum wa utoaji wa huduma za AI. Algorithm ya Frank-Wolfe isiyo kuu inaonyesha jinsi mbinu za kitamaduni za ubora zinaweza kubadilishwa kwa mifumo ya kisasa iliyosambazwa, sawa na maendeleo ya hivi karibuni katika ubora wa shirikisho (Konečný et al., 2016) lakini na marekebisho maalum kwa tatizo la pamoja la uwekaji, uchaguzi, na uelekezaji.

Kutoka kwa mtazamo wa vitendo, maboresho ya utendaji yaliyoonyeshwa katika matokeo ya majaribio (kupunguzwa kwa ucheleweshaji 25-40%) ni makubwa na yanaweza kuwa na athari halisi duniani kwenye programu zinazohitaji uhakiki wa AI wa ucheleweshaji mdogo, kama vile magari yenye kujitegemea na otomatiki ya viwanda. Ulinganisho na mbinu za msingi unaonyesha kikamilifu ukomo wa mbinu zilizopo, hasa kutoweza kwao kushughulikia changamoto za kipekee zilizosababishwa na miundo mikuu ya AI na mwendo wa watumiaji wakati huo huo.

Kutazamia mbele, utafiti huu unafungua mwelekeo kadhaa wenye matumaini. Ujumuishaji na teknolojia zinazokua kama mitandao ya 6G na mawasiliano ya satelaiti kunaweza kuongeza zaidi utumizi wa mfumo. Zaidi ya hayo, kama ilivyoelezwa katika uchunguzi wa hivi karibuni wa IEEE kuhusu akili ya kingo, tofauti inayoongezeka ya miundo ya AI na vichocheo vya maunzi vinaweka changamoto na fursa kwa ubora usio kuu. Kanuni zilizoanzishwa katika kazi hii zinaweza kuongoza ukuzaji wa mitandao ya kizazi kijacho ya AI-asili ambayo inaunganisha kikamilifu mawasiliano, hesabu, na akili.

8. Marejeo

Zhu, J. Y., Park, T., Isola, P., & Efros, A. A. (2017). Unpaired image-to-image translation using cycle-consistent adversarial networks. In Proceedings of the IEEE international conference on computer vision.
Chen, L., Liu, Y., & Zhang, B. (2022). Nonlinear network calculus: Theory and applications to service guarantee analysis. IEEE Transactions on Information Theory.
Konečný, J., McMahan, H. B., Yu, F. X., Richtárik, P., Suresh, A. T., & Bacon, D. (2016). Federated learning: Strategies for improving communication efficiency. arXiv preprint arXiv:1610.05492.
Mao, Y., You, C., Zhang, J., Huang, K., & Letaief, K. B. (2017). A survey on mobile edge computing: The communication perspective. IEEE Communications Surveys & Tutorials.
Wang, X., Han, Y., Leung, V. C., Niyato, D., Yan, X., & Chen, X. (2020). Convergence of edge computing and deep learning: A comprehensive survey. IEEE Communications Surveys & Tutorials.
Zhang, J., Vlaski, S., & Leung, K. (2023). Decentralized AI Service Placement, Selection and Routing in Mobile Networks. Imperial College London.